本福特定律表格,本福特定律通俗解释

首页 > 汽车 > 作者:YD1662023-02-03 17:24:40

一个问题

统计一下世界上237个国家的人口数量,你觉得其中以1开头的数会占多大比例,而以9开头的数又占多大比例呢?

如果你的回答是都为1/9,恭喜你你是正常人,但是事实却不是如此:以1开头的数惊人的占到了27%,而以9开头的数却只占5%。下图可以很形象的展示出在各国人口数量问题上,以各个数字开头的数占了多大的比例(见下图)。

本福特定律表格,本福特定律通俗解释(1)

为什么会相差这么大呢?这正是神秘的本福特定律在起作用。

本福特定律

也称为本福特法则,说明一堆从实际生活得出的数据中,以1为首位数字的数的出现概率约为总数的三成,接近直觉得出之期望值1/9的3倍。下表列出了在十进制首位数字的出现概率(%,小数点后一个位):

本福特定律表格,本福特定律通俗解释(2)

本福特定律的应用

这个分布规律适用的数据集几乎无穷无尽,包括河流的长度、城市和国家的人口、证券交易所的成交量,当然我们的会计数据(数据没有被人为操纵过)也同样适用。如果一组会计数据不符合本福特定律的话,就存在被篡改过的嫌疑。比如说,一家会计事务所对某公司的财务报表进行审查,发现会计数据中首位数是7、8、9的数字非常多,这就说明了管理者可能为了达到财务目标而修改了数据

本福特定律表格,本福特定律通俗解释(3)

因为如果做假账的人更改了账本上真实的数据,就会使账本上数字出现的频率发生变化从而偏离“本福特定律”。

另外,在那些假账中,数字5和6是最常见的开头数字,而不是符合定律的数字1,这就表明伪造者试图在账目中间“隐藏”数据。最为典型的就是美国安然公司“假账”事件。2001年曾是美国最大的能源交易商、年营业收入达近千亿美元、股票市值最高可达700多亿美元、全球500强中排名第七的安然公司在事先没有任何征兆的情况下突然宣布*,当时传出了该公司高层管理人员涉嫌做假账的丑闻,一时间,会计造假成了中外关注的焦点。事后人们发现安然公司在2001年度到2002年度所公布的每股盈利数字不符合“本福特定律”,这些数字的使用频率与这一定律有较大的偏差,这证明了安然公司的高层领导确实改动过数据

生活中还有很多的例子

——图书馆里大部分书的头几页通常比较脏。因为许多到图书馆看书的人大多只是看书的开头,不喜欢的话就不会再看下去了;把一本书完整看完的人比较少。靡不有初,鲜克有终。

——数学书后的对数表、化学书后的一些化学常数、财务课本后的终值、现值系数表等等,我们查阅的数据大多在头几页里面。

——如果统计的数据足够多,我们会发现,开头是数字1的数据最多,大约占了所有数据的三分之一;开头是2的数据居于其次;剩下的数字的数量依次递减。人口、死亡率、物理和化学常数、棒球统计表、半衰期放射性同位数、物理书中的答案、素数数字以及斐波纳契数列数字中均有这一定律的身影。换句话说也就是只要是由度量单位制获得的数据都符合“第一数字定律”

定律适用范围

第一,这些数据必须跨度足够大,必须横跨好几个数量级才能产生这个结果。

第二,有人为规则的数据就不满足次定律,比如说手机号码、身份证号、发票编号等数据,明显不满足这种对数分布律。也就是说,本福特定律正是没有任何限制才显露出来的定律,越是对数据的产生有人为限制,越是不满足该定律。

第三,数据不能经过人为修饰,随便人为修改的数据一般就不满足本福特定律了。

产生的根源

本福特定律产生的根源,就在于指数增长。这幅图可以直观的显示,如果一个变量随时间成指数增长的话,那么这个变量开头的数字随着时间的变化就应该是如下图:(横轴代表时间,纵轴代表那个变量)

本福特定律表格,本福特定律通俗解释(4)

显然,在某时刻你得到它以1开头的概率要大于9开头。而这是只取一个值的情况,如果是取大量的数据的话,在某时刻你观察到他以1开头的数据数量就大于以9开头的数量了。而指数增长的形式在自然界是十分普遍的,只要一个变量的增长率和他的大小成正比,结果就会是指数增长。比如说人类科技发展的速度大致和已有的科技成果成正比,所以人类的科技发展就是个指数增长;人口增长率会和已存在人口数成正比,因此没有资源限制的人口增长也是指数增长。指数增长是自然中极为普遍的一种变化规律,而这种变化规律可以直接导致本福特定律。

另外一种直观的解释(来自维基百科)是这样的:

从数数目来说,顺序从1开始数,1,2,3,…,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,…,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。

就以一个城市的所有门牌号为例,有的街道门牌号可能在100多就结束了,有的在500多结束,有的在900多结束。注意到500多结束那条街一定包含了1、10 和100~199这些1开头的门牌号,而不包含9开头的百位数,只包含9及90 的以9开头的数,这样一来明显以1打头的就多于9打头的了。然后对整个城市的所有街道做一个综合,最终就满足本福特定律了。(end)

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.