按照这个公式,不同的首位数概率如下:

本福特定律预测的首位数概率分布
首位是1的数据居然比首位是9的数据多出六倍?事实真的是这样吗?
数据检验我们需要使用一些数据来验证本福特定律,这些数据必须具有一些特点:
第一:数据产生于生活或者自然中的,而不能是人为规定的,例如新生儿数量、死亡人数就满足这个条件,而电话号码、邮政编码、彩票开奖号码,都不满足这个规律。
第二:数据量要足够大,并且跨越几个量级。例如不同国家国家的人口从几百到几十亿,跨越了7个量级,就符合条件。而成人的身高基本都在1米到2米之间,跨度太小,就不满足这个条件。
好了,现在我们可以进行验证了。首先,我选择我的视频播放量数据来验证本福特定律。我在某个平台上上传了266个科普视频,有些视频比较受欢迎,播放量比较大,比如视频《芯片是怎么回事》有两百多万次播放。也有一些播放情况不太好,只有一两万次播放。我把所有视频的播放次数统计了出来,统计出播放次数首数字为1的(无论是播放量1万多、十几万或者一百多万)、是2、是3…的视频个数,并且计算了它们各自所占的比例,如下所示:

某平台视频播放量首位数比例
如果我们把视频播放量的首位数比例和本福特定律预言的比例放在一起,就会发现:视频播放量基本符合本福特定律。

视频播放量首位数比例与本福特定律对比
我们再来用国家人口验证一下。 我查找了2000年世界上235个国家和地区的人口情况,人口首位数是1的国家有67个,占比28.5%。具体的首位数比例如下:
