贝叶斯公式口诀大全,一张图看懂贝叶斯定理

首页 > 经验 > 作者:YD1662024-03-22 16:37:59

我们是用什么方法在茫茫大海中寻找失联的飞机或者船只的呢?这要从天蝎号核潜艇说起。

1968年5月,美国海军的天蝎号核潜艇在大西洋亚速海海域突然失踪,潜艇和艇上的99名海军官兵全部杳无音信。按照事后调查报告的说法,罪魁祸首是这艘潜艇上的一枚奇怪的鱼雷,发射出去后竟然敌我不分,扭头射向自己,让潜艇中弹爆炸。为了寻找天蝎号的位置,美国政府从国内调集了包括多位专家的搜索部队前往现场,其中包括一位名叫John Craven的数学家,他的头衔是“美国海军特别计划部首席科学家”。在搜寻潜艇的问题上,Craven提出的方案使用了上面提到的贝叶斯公式。他召集了数学家、潜艇专家、海事搜救等各个领域的专家。

每个专家都有自己擅长的领域,但并非通才,没有专家能准确估计到在出事前后潜艇到底发生了什么。有趣的是,Craven并不是按照惯常的思路要求团队成员互相协商寻求一个共识,而是让各位专家编写了各种可能的“剧本”,让他们按照自己的知识和经验对于情况会向哪一个方向发展进行猜测,并评估每种情境出现的可能性。据说,为了给枯燥的工作增加一些趣味,Craven还准备了威士忌酒作为“投注”正确的奖品。

因为在Craven的方案中,结果很多是这些专家以猜测、投票甚至可以说赌博的形式得到的,不可能保证所有结果的准确性,他的这一做法受到了很多同行的质疑。可是因为搜索潜艇的任务紧迫,没有时间进行精确的实验、建立完整可靠的理论,Craven的办法不失为一个可行的办法。

由于失事时潜艇航行的速度快慢、行驶方向、爆炸冲击力的大小、爆炸时潜艇方向舵的指向都是未知量,即使知道潜艇在哪里爆炸,也很难确定潜艇残骸最后被海水冲到哪里。Craven粗略估计了一下,半径20英里的圆圈内的数千英尺深的海底,都是天蝎号核潜艇可能沉睡的地方,要在这么大的范围,这么深的海底找到潜艇几乎成了不可能完成的任务。

Craven把各位专家的意见综合到一起,得到了一张20英里海域的概率图。整个海域被划分成了很多个小格子,每个小格子有两个概率值p和q,p是潜艇躺在这个格子里的概率,q是如果潜艇在这个格子里,它被搜索到的概率。按照经验,第二个概率值主要跟海域的水深有关,在深海区域搜索失事潜艇的“漏网”可能性会更大。如果一个格子被搜索后,没有发现潜艇的踪迹,那么按照贝叶斯公式,这个格子潜艇存在的概率就会降低:

由于所有格子概率的总和是1,这时其他格子潜艇存在的概率值就会上升:

每次寻找时,先挑选整个区域内潜艇存在概率值最高的一个格子进行搜索,如果没有发现,概率分布图会被“洗牌”一次,搜寻船只就会驶向新的“最可疑格子”进行搜索,这样一直下去,直到找到天蝎号为止。

贝叶斯公式口诀大全,一张图看懂贝叶斯定理(1)

最初开始搜救时,海军人员对Craven和其团队的建议嗤之以鼻,他们凭经验估计潜艇是在爆炸点的东侧海底。但几个月的搜索一无所获,他们才不得不听从了Craven的建议,按照概率图在爆炸点的西侧寻找。经过几次搜索,潜艇果然在爆炸点西南方的海底被找到了。

由于这种基于贝叶斯公式的方法在后来多次搜救实践中被成功应用,现在已经成为海难空难搜救的通行做法。

提起贝叶斯公式,相信很多同学都会无奈地摇摇头,弯弯绕绕太多了,解题的时候一不小心就会出错。其实人工智能、无人驾驶、语音图片识别与大数据有什么关系?海难空难如何搜救?垃圾短信、垃圾邮件如何识别?这些看起来彼此不相关的领域之间会有什么联系吗?答案是,它们都会用到同一个数学公式——贝叶斯公式。它虽然看起来很简单、很不起眼,但却有着深刻的内涵。

贝叶斯公式口诀大全,一张图看懂贝叶斯定理(2)

对于概率,相信大家都不会感到陌生,最简单的就是扔骰子。扔出点数为5的概率是多少呢?我们会毫不犹豫的说:这个简单啊,概率就是1/6。

这个问题太简单了,如果我们只满足于此,就没什么研究意义了。我们把这个问题增加一个限定条件:已知扔出的骰子点数是奇数,再求扔的点数为5的概率是多少?发现没有,这个问题我们没有直接问扔出5这个事件的概率,而是增加了一个已知点数为奇数的前提。

生活中这类场景更多见,我们一般不会直接断定一个事件发生的可能性,因为这样做的实际意义并不大,而且很容易推断出结果。一般而言时间不会孤立发生,都会伴随其它一些条件的。比如,我问你下雨的概率是多少?这个问题会给你问的一头雾水,什么地点?什么时间?当日云层的厚度多少?推断的前提条件,一个都不知道,这样的推断没有意义。因为在实际应用中,我们更关心条件概率。

谁是贝叶斯?

托马斯·贝叶斯(Thomas Bayes,1701年-1761年)是英国神学家、数学家,皇家学会(世界上最古老的国家科学学会,也是英国促进科学研究的领先国家组织)会员。其他的科学家也加入了皇家学会, 例如牛顿,达尔文和法拉第。他提出了最重要的概率定理之一,并以他的名字命名:贝叶斯定理,或条件概率定理。

英国数学家托马斯·贝叶斯(Thomas Bayes)在1763年发表的一篇论文中,首先提出了这个定理。而这篇论文是在他死后才由他的一位朋友发表出来的。在这篇论文中,他为了解决一个“逆向概率”问题,而提出了贝叶斯定理。

在贝叶斯写这篇文章之前,人们已经能够计算“正向概率”,比如杜蕾斯举办了一个抽奖,抽奖桶里有10个球,其中2个白球,8个黑球,抽到白球就算你中奖。你伸手进去随便摸出1颗球,摸出中奖球的概率是多大。根据频率概率的计算公式,你可以轻松的知道中奖的概率是2/10。

而贝叶斯在他的文章中是为了解决一个“逆概率”的问题。同样以抽奖为例,我们并不知道抽奖桶里有什么,而是摸出一个球,通过观察这个球的颜色,来预测这个桶里里白色球和黑色球的比例。

这个预测其实就可以用贝叶斯定理来做。贝叶斯当时的论文只是对“逆概率”这个问题的一个直接的求解尝试,这哥们当时并不清楚这里面这里面包含着的深刻思想。然而后来,贝叶斯定理席卷了概率论,并将应用延伸到各个问题领域。可以说,所有需要作出概率预测的地方都可以见到贝叶斯定理的影子,特别地,贝叶斯是机器学习的核心方法之一。

为什么贝叶斯定理在现实生活中这么有用呢?这是因为现实生活中的问题,大部分都是像上面的“逆概率”问题。生活中绝大多数决策面临的信息都是不完全的,我们手中只有有限的信息。既然无法得到全面的信息,我们就应该在信息有限的情况下,尽可能做出一个最优的预测。

比如,天气预报说,明天降雨的概率是30%。这是什么意思呢?因为我们无法像计算频率概率那样,重复地把明天过上100次,然后计算出大约有30次会下雨,所以只能利用有限的信息(过去天气的测量数据),采用贝叶斯定理来预测出明天下雨的概率是多少。

同样的,在现实世界中,我们每个人都需要预测。要想深入分析未来、思考是否买股票、政策给自己带来哪些机遇、提出新产品构想,或者只是计划一周的饭菜。

贝叶斯定理就是为了解决这些问题而诞生的,它可以根据过去的数据来预测出概率。贝叶斯定理的思考方式为我们提供了明显有效的方法来帮助我们提供能力,以便更好地预测未来的商业、金融、以及日常生活。而且在有限的信息下,贝叶斯公式能够帮助我们预测出概率。所有需要作出概率预测的地方都可以见到贝叶斯定理的影子,特别地,贝叶斯是机器学习的核心方法之一。例如垃圾邮件过滤,中文分词,艾滋病检查,肝癌检查等。

我们简单来聊一聊贝叶斯公式:

贝叶斯公式

贝叶斯定理是在已经知道其他概率的情况下去求概率的方法。

P(A,B)=P(B,A), 这个公式表示联合概率,他的定义是这样的,左边表示A,B都发生的概率,同时它又等于B,A都发生的概率,因为这两句话其实是一句话,那么A,B都发生的概率怎么求呢?

P(A,B)可以表示P(A)* P(B| A),意思是A事件发生了,在A发生的条件下B事件也发生,也可以表示P(B)* P(A|B),意思是B事件发生条件下A事件也发生。这两个都可以表示A,B的联合概率。就可以在他们之间画上等号:P(A)* P(B| A) = P(B)* P(A | B)

公式简单变形之后就可以得到贝叶斯定理:

贝叶斯公式口诀大全,一张图看懂贝叶斯定理(3)

举个例子:若 P(火) 代表有火的可能性,P(烟) 代表有烟的可能性,则:

P(火|烟) 的意思是当有烟时,有火的可能性。

P(烟|火) 的意思是当有火时,有烟的可能性。

如果危险的火灾不常见(1%),但因为有工厂,烟比较常见(10%),而 90% 的危险火灾会产生烟,P烟=p烟│火*p(火)P烟=1%*90%=9%,所以9%有烟的情况也会有危险的火灾。

怎样去记:口诀法

想 "AB AB AB",然后这样分组:"AB = A BA / B"

贝叶斯公式口诀大全,一张图看懂贝叶斯定理(4)

大牛说他浑身发痒。有一个检测可以知道她是不是对猫过敏,但这个检测不一定是对的:

我们想知道当检测结果是 "有" 的时候,有这种过敏的可能性,我们吧我这个概率写为 P(过敏|有),公式是:

贝叶斯公式口诀大全,一张图看懂贝叶斯定理(5)

糟了!我们不知道检测结果是 "有" 的一般 可能性是多少呢?但我们可以把有这种过敏和没有这种过敏的概率相加来求这个一般概率:

我们把概率加起来:P(有) = 1% × 80% 99% × 10% = 10.7%;就是说大约 10.7% 的人会得到 "有" 的检测结果。

贝叶斯公式口诀大全,一张图看懂贝叶斯定理(6)

所以 P(过敏|有) = 大约 7%

转载:智点金融

栏目热文

文档排行

本站推荐

Copyright © 2018 - 2021 www.yd166.com., All Rights Reserved.