一个贝叶斯公式例子

2024-05-11 00:30

1. 一个贝叶斯公式例子

 最近看曹政推荐的《这才是心理学》,英文名 《How to Think Straight About Psychology》(号称贴吧之父俞军也推荐),这本书确实是好书。中间提到很多人都没有概率推理的概念,人的直觉在涉及概率时很容易犯错,因为人类真正搞清楚概率也就最近几百年的事情,而且仅限于小部分数学家,概率观还没有进入人们的常识性观念。
   《这才是心理学》书中里面有一个在一定情况下预估某人发病的概率,据说很多医生都会搞错(欧美国家的医生基本都是最顶尖的理科生,和中国不太一样)。条件是这样:
   就是下图的左上角数据(下图是我在公司里分享时的简单板书)。
                                           问题是如果目前有一个未知病史的人被测出 HIV 阳性,那么这个人真携带 HIV 的可能性是多少?就是上图的左下角问题,真阳性 (Positive) 的几率是多少?
   我问了好几个人,包括我自己的第一直觉都是这个人真携带 HIV 的可能性应该挺高的。但是实际上不是。
   我们可以用贝叶斯公式来解决这个问题(上图右上角的公式)。使用这个公式 最重要的是确定如何界定 A、B 事件分别是什么 ,以及他们的条件概率。(关于贝叶斯原理有很多很好的文章介绍,比如 这篇 。这里我就不再弄斧了。
   在上图中,我界定
   所以根据贝叶斯公式,就可以算出约为 2%(如上图中的右下角),其实概率挺低的。所以我们的直觉往往对于概率推理往往是有误导性。
   个人觉得直觉应用在对人的判断上很合适,比如判断一个人值不值信任,可以做长期朋友吗?往往见面的第一印象挺准的。但是对于一些涉及到计算、概率推理之类的,坚决不能依靠直觉,得好好算算。

一个贝叶斯公式例子

2. 两个小例子来理解贝叶斯公式

  关于贝叶斯公式,已经回炉学习过很多次了,但是感觉还是理解的不够深入,最近又重温了下,发现和工作生活还是很普遍的,可以不断的培养这种思维模式。 
  
   我做了如下的两个例子来理解贝叶斯公式。
  
  
 这个公式看起来比较有逼格。
  
 
  
  
 
                                          
 
  
 如果我们换一个角度来看,其实贝叶斯公式是加法公式和乘法公式的综合应用,如:
  
 P(A+B)=P(A)+P(B)  A,B互斥
  
 P(AB)=P(A)*P(B|A), P(A)>0
  
 
  
  
 
                                          
 
  
 它就好像是一个动态的天平,因为条件的变化而不断保持一种平衡,我来举两个例子。
  
 第1个是出行相关的,我们出门的时候通常会有多云天气,我们想根据日常的一些信息来判断是否会下雨。
  
 
  
  
 通过这些信息,我们如何得到问题的答案:
  
    今天多云 下雨的概率是多少
  
 我们假设 A为多云,B为下雨,则需要计算的是P(B|A)的值。
  
 A 多云
  
 B 下雨
  
 根据以上的信息,可以得到如下的信息:
  
 P(A|B)=0.5
  
 P(B)=0.1
  
 P(A)=0.4
  
 P(B|A)=P(B)*P(A|B)/P(A)
  
 =0.1*0.5/0.4=0.125
  
 
  
  
 再来一个例子,那就是和判断疾病相关的,一般的课本上都会有一个习题,我们描述下这个问题,假设是张三。
  
 
  
  
 我们可以设定两个事件:
  
 A 过敏
  
 B 有
  
 然后根据如上的信息,可以得到如下的信息,当然这次就比较纠结了。
  
 P(B|A)=0.8
  
 P(B|~A)=0.1
  
 P(A)=0.01
  
 P(A|B)=?
  
 好像到了这里,没法直接套用公式了,我们得做下折中。
  
 不过我们可以把有这种过敏和没有这种过敏的概率相加来求这个一般概率:
  
 
  
 1% 的人有这种过敏,检测对 80% 的这些人说 "有"
  
 99% 的人没有这种过敏,检测对 10% 的这些人说 "有"
  
 P(B)
  
 =0.01*0.8+0.99*0.1=0.099+0.008
  
 =0.107
  
 计算概率得:
  
 P(A|B)=P(A)*P(B|A)/P(B)
  
 =0.01*0.8/0.107
  
 =0.0748
  
 
  
  
 所以整体算下来概率也不高,这个时候再来看公式,其实就是会清晰一些了。 

3. 贝叶斯公式通俗理解

  贝叶斯公式:  
                                           
   推导之前,我们需要先了解一下 条件概率 :
                                           
   已知数据如下:
   P(A) 表是人为光头的概率,P(B) 表示为人为程序员的概率。   则 P(A) = 4/9 ,P(B) = 3/9 = 1/3 ,P(A, B) = 2/9   P(A|B) 则为程序员中光头的概率为:2/3   P(B|A) 则为光头中程序员的概率:2/4 = 1/2   则按照条件概率:P(A|B) = P(A, B)/ P(B) = 2/3   贝叶斯公式:P(A|B) = P(A)·P(B|A)/P(B) = 2/3   通过上面连个公式推导发现 条件概率 和 贝叶斯 的结果是一样的。

贝叶斯公式通俗理解

4. 贝叶斯公式的理解

能把P(城市|省份)和P(省份|城市)联系起来的公式叫贝叶斯公式。我们来看贝叶斯公式长什么样子。
                                          
 用A表示省份,B表示城市,套入公式,即能把P(城市|C)和P(C|城市)联系起来。看到能够联系起来,上级工作人员很高兴,但是这公式有什么意义吗,是不是随便编造的一个公式,为何叫贝叶斯公式而不是叫陈佩斯公式?
  
 贝叶斯公式以托马斯·贝叶斯(Thomas Bayes,1701-1761)命名的,贝叶斯是和牛顿同时代的牧师,同时也是一位业余数学家,和牛顿不同的是,贝叶斯的理论当时并未被重视,原因在于贝叶斯在统计当中引入了主观因素,即所谓的先验概率,这对于数学来说是大忌,数学应该是客观的,怎么能加入主观因素。因此,直到1950年左右,人们发现加入先验概率效果更好,贝叶斯的理论才被广泛接受。
  
 
  
                                          
 
  
  
     一个理论能被广泛接受,一定是因为能够解决很多问题,那贝叶斯理论又解决了什么问题,为什么一个数学理论能够加入主观因素?
  
   如果问抛硬币正面朝上的概率,很多人会肯定回答说概率是1/2,但这是想当然了,对于理想的硬币,正反面概率是均匀的,但是如果硬币动了手脚,那就不一定了,这个时候,要怎么去确定概率是多少?有人想到通过做抛硬币的试验来确定,例如抛5次硬币,统计正面和反面出现的次数,如果抛5次都是正面向上,我们能说正面向上的概率是100%吗?有人说,5次太少,那抛5000次以上总能计算概率大小吧,答案是可以,只是这种估计概率的方式成本太高了。事实上,现实生活中,有很多类似的例子是不能通过做试验来确定概率的,例如小明预测明天下雨的概率是30%,他无法重复过上明天100次,统计下雨的次数来计算下雨的概率。而贝叶斯理论,可以解决这种在有限信息条件下对概率的一个预估,贝叶斯理论的思路是, 在主观判断的基础上,先估计一个值(先验概率),然后根据观察的新信息不断修正(可能性函数) 。
  
 我们继续来看贝叶斯公式,我们再用省份和城市来理解这个公式有点不太好理解,因为那个例子看起来我们所有的信息都知道了。这里再举另外一个例子来理解。
  
 曾经有一个大神给我传授表白理论,他说如果女神从来没有单独出去逛街吃饭,这说明女神根本不喜欢你,表白的成功概率很低的,反之亦然。
  
 我们以这个理论作为概率的例子,首先,分析给定的已知信息和未知信息:
  
 1)要求解的问题:女神喜欢你,记为A事件
  
 2)已知条件:经常和女神单独出门吃过饭,记为B事件
  
 那么,P(A|B)就是女神经常和你单独出门吃饭这个事件(B)发生后,女神喜欢你的概率。把这个套入贝叶斯公式来理解一下。
  
 
  
                                          
 贝叶斯可以分为三个部分,先验概率、可能性函数和后验概率。
  
 1)先验概率
  
 我们把P(A)称为"先验概率"(Prior probability),先验概率是根据以往经验和分析得到的概率。这个例子里就是在不知道女神经常和你单独出门逛街的前提下,来主观判断出女神喜欢你的概率。因为是主观判断,我们可以给任何值,例如高富帅可以把这个概率设定得很高,为80%,也可以设定低一点,例如50%,这完全是根据个人经验做出的判断。这也是前面说的贝叶斯公式的主观因素部分。
  
 2)可能性函数
  
 P(B|A)/P(B)称为"似然函数"(Likelyhood),这是一个调整因子,即新信息B带来的调整,作用是使得先验概率更接近真实概率。至于新信息带来的调整作用大不大,还得看因子的值大不大。
  
 如果"可能性函数"P(B|A)/P(B)>1,意味着"先验概率"被增强,事件A的发生的可能性变大,例如女神平时很少和别人出门逛街吃饭,那么这个调整因子特别有用,肯定是大于1的。
  
 如果"可能性函数"=1,意味着B事件无助于判断事件A的可能性,例如女神偶尔也和他人出门逛街吃饭,那么和女神出门吃饭没有我们带来任何信息,对判断女神是否喜欢你没有重大意义;
  
 如果"可能性函数"<1,意味着"先验概率"被削弱,事件A的可能性变小,例如知道女神实际上有喜欢的人了,那该信息直接使得女神喜欢你的概率下降很厉害。
  
 至于为什么似然函数的公式长这样的,这个留在以后再解释。
  
 3)后验概率
  
 P(A|B)称为"后验概率"(Posterior probability),即在B事件发生之后,我们对A事件概率的重新评估。这个例子里就是在女神跟你出门逛街吃饭这个事件发生后,对女神喜欢你的概率重新预测。
  
 通过这个例子,我们理解了贝叶斯公式,也知道了贝叶斯公式能够通过似然函数不断调整主观概率得到后验概率,使得预测更加准确,这也是为什么带有主观因素还能在数学界呆着的原因。也正因为这样,贝叶斯可以出现在所有需要作出概率预测的地方,例如垃圾邮件过滤,中文分词,疾病检查等。特别是在机器学习领域,贝叶斯理论更是一个绕不过去的门槛。

5. 贝叶斯公式怎么理解

贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。

贝叶斯的统计学中有一个基本的工具叫贝叶斯公式、也称为贝叶斯法则,尽管它是一个数学公式,但其原理毋需数字也可明了。如果你看到一个人总是做一些好事,则那个人多半会是一个好人。这就是说,当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。
用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。
贝叶斯公式又被称为贝叶斯定理、贝叶斯规则是概率统计中的应用所观察到的现象对有关概率分布的主观判断进行修正的标准方法。

贝叶斯法则:
通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系,贝叶斯法则就是这种关系的陈述。
作为一个规范的原理,贝叶斯法则对于所有概率的解释是有效的;然而,频率主义者和贝叶斯主义者对于在应用中概率如何被赋值有着不同的看法:频率主义者根据随机事件发生的频率,或者总体样本里面的个数来赋值概率;贝叶斯主义者要根据未知的命题来赋值概率。一个结果就是,贝叶斯主义者有更多的机会使用贝叶斯法则。
贝叶斯法则是关于随机事件A和B的条件概率和边缘概率的。


贝叶斯公式怎么理解

6. 贝叶斯公式

2021/5/14
  
 今天晚上回顾贝叶斯公式,看了b站上的视频 BV19V411o7Pu,感觉有了更新的认识,越发感觉这是一个十分深刻的公式,同时对概率论也有了新的思考,感觉数学的终极真的到了哲学的层面了。
  
 视频中老师讲到,贝叶斯公式其实表面上就是条件概率的变形,但是它蕴含着一种深刻的思考方式,描述了学习这一过程。
  
 
  
            
   : 观察得到的数据(结果)
  
   : 认知
  
   : posterior  获取数据后我们对于认知的刻画
  
   : prior  我们最开始没有获取数据,即没有学习时的认知(没有认知也算一种认知)
  
   : likelihood  在我们有初始认知时数据的规律
  
   : evidence  常数,在这里不用管
  
 这个公式其实揭示了一切学习都是一个主观的过程,都是建立在已有的认知基础上来看待数据的,然后通过数据来得到新的认知。
  
 假如初始认知和数据没有关系,在初始认知基础上看数据看到的是纯粹的数据的话,那么有  和  是独立的,那么等式两边有  ,即什么都没有学到。就是说如果用十分可观的眼光去看数据,那么你将什么都学不到。
  
 真的头一次感到一个小小的公式有这样深刻的内涵,数学确实美呀!

7. 贝叶斯公式

最近因为听播客,对概率学产生了极大的兴趣的。
  
 吐槽一下:没想到我一个从高中开始就不愿意学数学的人会有对概率学产生兴趣的一天。不过话说回来,如果当初的数学老师把那些理论结合到生活实例上的话,我想我不会如此厌弃数学。毕竟我从高中开始不喜欢数学的原因就是“学这跟我的生活有什么关系,我买菜需要用代数、微积分吗”
  
  思考题:胡润富豪榜国内上榜人士半数没有高学历,所以读书无用吗? 
  
 你觉得这句话有道理吗?
  
 接下来先了解一下贝叶斯公式,然后我们再来讨论这道题。
  
 贝叶斯定理是关于 随机 事件A和B的 条件概率 (或 边缘概率 )的一则定理。其中P(A|B)是在B发生的情况下A发生的可能性。
  
 
  
                                          
 再来一个比较直观的,
                                          
 经典例子:
  
 两个一模一样的碗,一号碗有30颗水果糖和10颗巧克力糖,二号碗有水果糖和巧克力糖各20颗。现在随机选择一个碗,从中摸出一颗糖,发现是水果糖。请问这颗水果糖来自一号碗的概率有多大?
  
 首先分清楚现象和规律。
  
 拿出来1颗糖,可能是水果糖,也可能是巧克力糖,这是两个现象。
  
 这颗糖,可能是从1号碗来的,也可能是从2号碗来的,这是两个规律。
  
 所以组合之后,有4种情况: 1号碗水果糖0.75 ,1号碗巧克力糖0.25, 2号碗水果糖0.5 ,2号碗巧克力糖0.5。
  
 套用公式:P(从一号碗来规律|水果糖现象)=P(水果糖现象|从一号碗来规律) P(从一号碗来规律)/P(水果糖现象)=0.75* 0.5/0.625=0.6。
  
 最终得出:这颗水果糖来自1号碗的概率是0.6
  
 回到上面那个思考题,首先由题目可知:无论有没有高学历进入胡润富豪榜的概率都是0.5。
  
 以上面的例子来打比方,进入富豪榜和未进入富豪榜的分别为水果糖和巧克力糖,高学历的是1号碗,低学历的是2号碗,这两个碗进入富豪榜的概率都是0.5。
  
  But,这个进入富豪榜的0.5在原先的两个碗里所在的比例是完全不一样的!这颗水果糖想要被选中,那它在1号碗的概率是0.75,而在2号碗的概率则只有0.5。 
  
  虽然总数不变,但是对于个体来说,这个概率上的不同所带来的的差距却是天翻地覆的。 
  
 题目所在的年份,整体环境,根据国家统计局颁布的《2010年第六次全国人口普查主要数据公报》,得知中国大陆:
  
 具有大学(指大专以上)文化程度的人口为119636790人 ; 而当年中国人口是134091万人,
  
 计算得大专以上的人口比例为8.9%
  
 其中本科生的比例更低,仅有2.7%
  
  也就是说,仅占总人口2.7%的本科以上的高学历人口,占据了进入富豪榜总人数的50%。对于个体来说,如果你想要实现进入胡润富豪榜的目标,那么你在高学历碗里的成功率远远高于你在低学历碗里。 
  
 具体的计算方法,可以参见知乎。类似的例子还有预测病人发病率真实性等等,有兴趣的可以多搜索一些看看。

贝叶斯公式

8. 如何理解贝叶斯公式

        设A,B是两个事件,且  ,则在事件B发生的条件下,事件A发生的条件概率为:
  
                                                             
  
 一般事件A和B是同一实验下,不同结果组成的合集
                                          
 根据韦恩图来理解一下:“事件B发生的条件下,事件A发生的条件概率”。“事件B发生” = 样本的可选范围限制在B圈中,在这个情况下,A发生的概率(P(A|B)) = AB交集的样本数/B的样本数,通过分母相消,简化成概率相除。
  
         由条件概率得:
  
                                   
  
 进一步推广得:对于任意正整数  ,当  时,有:
  
          
  
         事件组  满足:
  
             1.   两两互斥,即  且  
  
             2.   
  
 则称事件组  是 样本空间的  的一个划分。 
  
 通俗讲,A发生的概率 =   发生的条件下A发生的概率和。
  
 
  
                                          
 某实验样本的集合为  ,圆圈A代表事件所能囊括的所有样本,  为  的一个划分,A的样本数目可以通过与Bi的交集来获得,=(A∩B1的样本数)+(A∩B2的样本数)+····+(A∩Bn的样本数)。样本数公式和概率公式,本质上是一样的东西。
  
          贝叶斯公式: 设  是样本空间  的一个划分,则对任一事件A,有
  
                                            
  
 贝叶斯公式=全概率公式+乘法公式。解释:当事件A发生(或A为真)的条件下,  发生(或  为真)的概率。是在反溯事件发生的原因。
  
 
  
  
 小华很害羞而且性格孤僻,虽然乐于助人,但却对周围的人或现实世界不太感兴趣。一个温顺而又井井有条的人,他做事条理性喜,热衷于钻研细节。综上,你认为“小华是一个图书管理员”或者“小华是一个农民”那个概率大?
                                          
 答:小华是农民的概率大。下面我们使用贝叶斯公式来算一下
  
  a. 在没有限制条件下,问:小华是什么工作?(这里我们假设只有管理员和农民两个选项)
  
  答:农民, 根据国家统计局2017年发布数据,中国共有5.7亿农村人口,去除2.3亿外出务工人员,真正职业为农民的人数为3.4亿。中国的图书管理员人数为0.37亿(我瞎说的,计算方便)。那么小华是农民的概率为:3.4/(3.4+0.37)=90%,是管理员的概率为:0.1。
  
  b. 那么根据条件1,问:小华的工作是什么?
  
  答:农民, 根据我们的认知,图书管理员中符合条件1描述的比例大概为40%,用概率论的公式表示:  。农民中符合条件1描述的比例大概为10%(我知道“我爱发明”中有很多热爱钻研的农民,不用提醒我),用概率论的公式表示:  。假设全国总人数为100,那么农民为90人,管理员为10人。在根据条件1的概率,符合条件1的农民:90*10%=9人,符合条件1的管理员:10*40%=4人,所以农民的概率大。
  
 根据贝叶斯公式:
  
 在满足条件1的情况下(条件1为真时),小华是图书馆员的概率:
  
   
  
  注:其中,农民和管理员在总人数的比例我们称之为:先验概率。 
  
  c. 条件2:小华爱好书法,问:小华的工作是什么?
  
  答:管理员。 当a,b中的条件为真时,图书管理员爱好书法的概率为50%,农民爱好书法的概率为10%。那么根据贝叶斯公式:“小华爱好书法” 为真,则小华的工作是图书管理员的概率:
  
                          
  
  注:其中,满足问题ab的农民和管理员人数之比例我们称之为:先验概率。 
  
 
  
                                          
 问题的关键不是在于,人们对图书管理员和农民的形象认识是否有偏差, 而是在于,一般人做判断的时候,没人把农民和图书管理员的比例信息考虑进去, 这个比例是否准确不重要,重要的是,你是否考虑过。如果你考虑了,最起码可以做一个粗略的估计, 所以,理性不是说知道事实,而是知道哪些因素会影响事实。 
  
 鸣谢:B站up主:3Blue1Brown,传送门:  https://www.bilibili.com/video/av84799361 
  
  3.你是否患有肝癌?狼是否来了?
最新文章
热门文章
推荐阅读