影响公式结果WR的共有四个量,三个变量和一个定量。
第一个是v,意思是评价人数;
只有达到一定条件的用户,所提交的评分才会有效,才能成为变量v。
第二个是m,意思是基准票数;
这是一个定量,只有达到25000个评价,才有资格进入到统计之中。
第三个是R,意思是这部电影的平均分;
也就是按豆瓣算法计算出来的分数。
第四个是C,全站所有电影的平均分。
从公式可以看出,结果WR是由R和C分别乘以基准票数和评价人数所组成变量相加得出来的。
要特别注意的是两个由基准票数和评价人数所组成变量,v ÷ (v m)和m ÷ (v m)。
两个变量都有v m,但分子是不同的。
如果v越大,也就是参与进来的评价人数越多,v ÷ (v m)就越大,要乘以它的R数值也会越大,那WR的结果越是接近这部电影本来的平均分。
假设v的人数刚好就是25000,那么v ÷ (v m)的结果就是0.5,就算这25000人的平均分是9分, 按(v ÷ (v m)) × R算出来也只有4.5分。
如果全站所有电影的平均分C只有6分,(m ÷ (v m)) × C算出来是3分,那么WR算出来只有7.5分。
C这一变量拉低了分数,所以Top250的分数都要比常规分数要低一些。
只有v的人数足够多的时候,WR的结果才能够更加受到R的影响。
这个设定防止了某部电影只有狂热粉丝投票,或是大量新注册用户刷票,导致分数虚高的问题。同时也使得冷门电影和热门电影有了可比性。
不管一部新出来的电影有多少欢迎,如果v的人数不够多,也很难在Top250榜单名列前茅。
只有随着时间的推移,参与评价的v或者成为v的用户越来越多,Top250榜单才会受到一定的影响。
反观豆瓣Top250榜单,《我不是药神》等口碑热门电影都很容易一下子就把一些经典电影挤下去,现在排名比《教父2》还要高,这并没有经过时间的验证,其权威性自然不及IMDb。