贝叶斯定理提供的是一种逆条件概率的方法,本文简单总结了贝叶斯定理是什么,贝叶斯定理应用的理解,以及贝叶斯定理在AI场景下的应用,目的是希望产品经理了解到这个定理的能力后,在设计相关推荐或是具有推理功能的应用场景,能通过贝叶斯定理来解决。
一、贝叶斯定理介绍
其中:
- P(B|A)表示:在事件A发生的前提下,发生事件B的概率;
- P(A|B)表示:在事件B发生的前提下,发生事件A的概率;
- P(A)表示:发生事件A的概率;
- P(B)表示:发生事件B的概率。
以上公式就是贝叶斯定理,它提供的是一种逆条件概率的方法。
举一个经常用的例子:
比如阴天的概率是40%,下雨的概率是10%,下雨天是阴天的概率是50%,那么今天是阴天下雨的概率就是P(雨|阴)=10%*50%/40%= 12.5%。
通过概率计算发现今天阴天下雨的概率比较低,可以安心出行了。
因此,贝叶斯定理是条件概率的推断问题,这对于人们进行有效的学习和判断决策具有十分重要的理论和实践意义。
二、贝叶斯定理举例说明
对于贝叶斯定理的应用,难点在于两个事件A和B的界定与应用:为什么是B条件下的A的概率,而不是A条件下B的概率,P(A|B)和P(B|A) 之类的经常让人混淆。也就是在我们的场景中哪些定义为事件A,哪些定义为事件B。
我在学习这里的时候也有一些困惑,看了一些文章,有了一定的理解:比如两个事件A和B,这两个事件是相关的,在A事件下有发生B概率的可能性,在B事件下有发生A事件的可能性。
但是统计发现:在A条件下事件B的现象更容易观测与统计,但是A的发生或是不发生也是有一定的规律,但是这种规律更容易观测,因此我们可以定义A是可观测的规律,B是此规律下某一个现象,那么贝叶斯公式就可以理解为观察到的现象去推断现象后的规律所发生的概率问题。
那么贝叶斯定理可以理解为如下公式:
比如以下案例:
比如我们有两个箱子,箱子中分别有黑球和白球,其中箱子1有10个黑球、10个白球,箱子2中有5个黑球,15个白球。那我们随机选择一个箱子,从箱子中摸出一个球,发现是黑球,那么问这个黑球来自于一号箱子的概率是多大?
那么在上问题上不难理解:摸出来黑球和白球是两个现象,但是我们又发现黑球和白球在不同箱子里面概率是不一样的,因此箱子就是两个规律,这两个规则控制着现象的发生的概率,并且是容易观测得出概率的。
再比如,第一节说的下雨和阴天的事件,这里面也有两个规律和两个现象:天气下雨和不下雨是两个规律,阴天和不是阴天是两个现象。我们从下雨中发现是阴天的便于观测和统计的,我们通过观察天气是阴天,推断下雨不下雨就是一个推论。
所以,再利用贝叶斯公式的时候,注意区分哪个事件是现象,哪个事件是规律,通过规律下的现象是容易观测统计的,在某一现象下推断规律就是个推断的概率。
三、贝叶斯定理AI应用说明
通过以上我们发现:贝叶斯定理提供了一种发现逻辑,它与大脑的推理机制有很大的相似性,因此贝叶斯理论是人工智能中学习和推断的重要分支。
美国心理学家MARR认为人脑有三个层次:计算层、算法层、实现层,
- 计算层更多的是对获取的信息的处理,比如学习知识,记忆知识
- 算法层是更加抽象的认知活动,比如归纳、推理等
- 实现层更多是对抽象出来的算法进行相应生物机制的实现
根据上面我们不难理解:贝叶斯理论是类脑计算的一个算法框架,因此,了解贝叶斯理论对理解人工智能的实现有着很重要的作用。
要具体了解贝叶斯定理在人工智能中的应用,我们需要在对这个公式进行一下转换。
我们把P(A)称为”先验概率”,即在B事件发生之前,我们对A事件概率的一个判断;P(A|B)称为”后验概率”(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估;P(B|A)/P(B)称为”可能性函数”,这是一个调整因子,使得预估概率更接近真实概率。
所以,条件概率可以理解成下面的式子:
后验概率=先验概率*调整因子
这就是贝叶斯推论。
我们先预估一个”先验概率”,然后加入在这个先验概率规律下发生某现象的概率,看这个现象到底是增强还是削弱了”先验概率”,由此推论出更接近事实的”后验概率”,也由此得出对于一个后验概率P(A|B)的增强或是削弱由两个因素来决定的。
举一个例子:拼写错误的纠正
当用户输入一个词汇,可能正确,可能错误,我们可以设定P(正确)是此正确词的概率,P(错误)是此错误词的概率,当用户输入一个词是错误的,我们系统要推断出正确的词给用户,这就是拼写错误的纠正,也就是P(正确|错误)概率越大,我们纠正的正确率也就越高。
也就是说我们知道这个词是错误的,然后去推断一个匹配度很高的正确的词汇给用户,定理中我们已知这个词的错误概率P(错误),那么我们只要最大化P(错误|正确)* P(正确)的词就可以,因此找到一个正确的词汇出现这个错误的词汇概率最高的一个正确的词就可以。
我们再举一个互联网的推荐的例子,比如我们某一用户画像下(例如80后女性)购买某一商品可能性,可能性最高的推荐给这些用户画像下的用户,根据互联网平台掌握的此商品浏览后购买概率,某一用户画像下用户浏览此商品的概率,某一用户画像下用户浏览此商品后够买的概率。这三个概率指标,可以找到某一用户画像下购买某商品概率最高的推荐出来。
除此之外,经常应用到的案例就是垃圾邮件的分类,小伙伴可以自行思考或寻找相关文献。
以上是简单总结了贝叶斯定理是什么,贝叶斯定理应用的理解,以及贝叶斯定理在AI场景下的应用,目的是希望我们做产品经理的了解到这个定理的能力后,在我们设计相关推荐或是具有推理功能的应用场景,我们是否能通过贝叶斯定理来解决!
其实,贝叶斯理论除了贝叶斯定理之外,还有贝叶斯分析、贝叶斯逻辑、贝叶斯网络、贝叶斯分类器、贝叶斯决策、贝叶斯学习等相关理论与实践,并在以上知识在人工智能领域都有应用,如果感兴趣的小伙伴可以参考相关文献进行深度研究。
关于贝叶斯定理就说到这里,个人最近也是在做AI产品相关设计,也是在学习和实践中,本章就是阅读相关文献后的总结与分享,欢迎小伙伴给出建议和意见!
本文由 @罗飞 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议