贝叶斯准则怎么解释?

2024-05-10 20:55

1. 贝叶斯准则怎么解释?

贝叶斯判决准则
Bayes decision rule
作者 :赵履骏
【本书体例】 【大 中 小】
    贝叶斯判决准则又称贝叶斯判决规则,它是理论上的最佳准则。因为它是一种可使全部判决的平均风险为最小的准则。

    设有M个可能发生的消息的先验概率已知,且为P(Hi)(j=0,1,…,M-1),若实际存在的消息是j,但被判定为i,定义其判别代价(损失)为Lii,假定Lij(i=0,1,…,M-1;j=0,1,…,M-1)已经确定。贝叶斯准则是对于任何一组观测数据,选择假设Hj,其产生的平均风险最小。据平均风险之定义,有

    



式(1)中,P(Hi|Hj)表示为Hj为真时,选择Hi的概率。

    选择使平均风险为极小的假设,与选择使条件风险为极小的假设是等效的。条件风险的定义为

    



式(2)即给定一组测量数r,判决假设Hj为真时的风险性。P(Hi|r)称为后验概率,即给定r,Hi为真的概率。

贝叶斯准则怎么解释?

2. 贝叶斯法则的特点


3. 贝叶斯推理的介绍

贝叶斯推理是由英国牧师贝叶斯发现的一种归纳推理方法,后来的许多研究者对贝叶斯方法在观点、方法和理论上不断的进行完善,最终形成了一种有影响的统计学派,打破了经典统计学一统天下的局面。贝叶斯推理是在经典的统计归纳推理——估计和假设检验的基础上发展起来的一种新的推理方法。与经典的统计归纳推理方法相比,贝叶斯推理在得出结论时不仅要根据当前所观察到的样本信息,而且还要根据推理者过去有关的经验和知识。

贝叶斯推理的介绍

4. 贝叶斯法则的举例分析

 全垄断市场,只有一家企业A提供产品和服务。企业B考虑是否进入。当然,A企业不会坐视B进入而无动于衷。B企业也清楚地知道,是否能够进入,完全取决于A企业为阻止其进入而所花费的成本大小。挑战者B不知道原垄断者A是属于高阻挠成本类型还是低阻挠成本类型,但B知道,如果A属于高阻挠成本类型,B进入市场时A进行阻挠的概率是20%(此时A为了保持垄断带来的高利润,不计成本地拼命阻挠);如果A属于低阻挠成本类型,B进入市场时A进行阻挠的概率是100%。博弈开始时,B认为A属于高阻挠成本企业的概率为70%,因此,B估计自己在进入市场时,受到A阻挠的概率为:0.7×0.2+0.3×1=0.440.44是在B给定A所属类型的先验概率下,A可能采取阻挠行为的概率。当B进入市场时,A确实进行阻挠。使用贝叶斯法则,根据阻挠这一可以观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.7(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.44=0.32根据这一新的概率,B估计自己在进入市场时,受到A阻挠的概率为:0.32×0.2+0.68×1=0.744如果B再一次进入市场时,A又进行了阻挠。使用贝叶斯法则,根据再次阻挠这一可观察到的行为,B认为A属于高阻挠成本企业的概率变成A属于高成本企业的概率=0.32(A属于高成本企业的先验概率)×0.2(高成本企业对新进入市场的企业进行阻挠的概率)÷0.744=0.086这样,根据A一次又一次的阻挠行为,B对A所属类型的判断逐步发生变化,越来越倾向于将A判断为低阻挠成本企业了。以上例子表明,在不完全信息动态博弈中,参与人所采取的行为具有传递信息的作用。尽管A企业有可能是高成本企业,但A企业连续进行的市场进入阻挠,给B企业以A企业是低阻挠成本企业的印象,从而使得B企业停止了进入地市场的行动。应该指出的是,传递信息的行为是需要成本的。假如这种行为没有成本,谁都可以效仿,那么,这种行为就达不到传递信息的目的。只有在行为需要相当大的成本,因而别人不敢轻易效仿时,这种行为才能起到传递信息的作用。传递信息所支付的成本是由信息的不完全性造成的。但不能因此就说不完全信息就一定是坏事。研究表明,在重复次数有限的囚徒困境博弈中,不完全信息可以导致博弈双方的合作。理由是:当信息不完全时,参与人为了获得合作带来的长期利益,不愿过早暴露自己的本性。这就是说,在一种长期的关系中,一个人干好事还是干坏事,常常不取决于他的本性是好是坏,而在很大程度上取决于其他人在多大程度上认为他是好人。如果其他人不知道自己的真实面目,一个坏人也会为了掩盖自己而在相当长的时期内做好事。 考虑一个医疗诊断问题,有两种可能的假设:(1)病人有癌症。(2)病人无癌症。样本数据来自某化验测试,它也有两种可能的结果:阳性和阴性。假设我们已经有先验知识:在所有人口中只有0.008的人患病。此外,化验测试对有病的患者有98%的可能返回阳性结果,对无病患者有97%的可能返回阴性结果。上面的数据可以用以下概率式子表示:P(cancer)=0.008,P(无cancer)=0.992P(阳性|cancer)=0.98,P(阴性|cancer)=0.02P(阳性|无cancer)=0.03,P(阴性|无cancer)=0.97假设有一个新病人,化验测试返回阳性,是否将病人断定为有癌症呢?我们可以来计算极大后验假设:P(阳性|cancer)p(cancer)=0.98*0.008 = 0.0078P(阳性|无cancer)*p(无cancer)=0.03*0.992 = 0.0298因此,应该判断为无癌症。

5. 贝叶斯定理的研究意义

人们根据不确定性信息作出推理和决策需要对各种结论的概率作出估计,这类推理称为概率推理。概率推理既是概率学和逻辑学的研究对象,也是心理学的研究对象,但研究的角度是不同的。概率学和逻辑学研究的是客观概率推算的公式或规则;而心理学研究人们主观概率估计的认知加工过程规律。贝叶斯推理的问题是条件概率推理问题,这一领域的探讨对揭示人们对概率信息的认知加工过程与规律、指导人们进行有效的学习和判断决策都具有十分重要的理论意义和实践意义。

贝叶斯定理的研究意义

6. 我想知道贝叶斯法则的具体含义是什么

贝叶斯法则,是指当分析样本大到接近总体数时,样本中事件发生的概率将接近于总体中事件发生的概率。
百度百科里有,你自己查吧

7. 贝叶斯推理的名词详解

作为一种推理方法,贝叶斯推理是从概率论中的贝叶斯定理扩充而来。贝叶斯定理断定:已知一个事件集Bi(i=1,2,...k)中每一Bi的概率P(Bi),又知在Bi已发生的条件下事件A的条件概率P(A/Bi),就可得出在给定A已发生的条件下任何Bi的条件概率(逆概率)P(Bi/A)。即P(Bi/A)=P(Bi)P(A/Bi)/(P(B1)P(A/B1)+P(B2)P(A/B2)+...+P(Bn)P(A/Bn))贝叶斯定理有很广的应用范围,但作为研究贝叶斯推理的起点,我们必须扩充这个定理的意义。不考虑事件集Bi,而考虑构成实际情况的一个合适模型的假说集Hi(i=l,2,...k),其中一个而且仅仅一个假说必定是真的。事件A则被重新解释为由实际情况得到的观察结果E:样本数据。在观察之前,对所有的i=l,2,...k,已知P(Hi),它们是不同假说的先验概率,构成次要的信息来源。又知P(E/Hi)即在Hi真时E被观察到的概率,它们是样本数据的似然值,也叫E相对于Hi的后验概率。经过这样的解释,贝叶斯定理仅由适用给事件测定概率变成也能给假说测定概率(可信度)的工具。

贝叶斯推理的名词详解

8. 贝叶斯推理的影响因素

 贝叶斯推理问题总是通过某种具体事例来进行表述的。Kahneman和Amos Tversky认为,被试在概率推理中使用了代表性启发式(representativeness heuristics),他们进行推断所依据的是问题内容中特征对事件的代表性程度而不是贝叶斯规则删。按照他们的理论,在前述的乳腺癌问题中,由于阳性的检查结果很大程度上代表了有病的信息,所以被试在判断中忽略了问题的基础概率,而主要根据击中率信息进行推理。Gavanski等同所提出的自然抽样空间(natural sample spaces)理论认为,被试的判断错误不在于忽略了基础概率,而是把后验概率P(H/D)表征为了击中率P(D/H),因为从事件H (患有乳腺癌)中抽取特征D (检查呈阳性)的取样方式更为自然。或者说,事件是原因,特征是结果,从原因到结果的取样方向才更符合人类的思维习惯。事件与特征之间的因果关系或代表性程度都是由问题的内容所决定,因此可以认为这两种理论都是从问题内容角度来解释贝叶斯推理中的认知错觉的。后来的一些研究者虽然也使用了不同内容的贝叶斯问题,但主要是考察它们的平均效应,很少考虑到问题内容对贝叶斯推理的影响。Girotto和Gonzalez(2001)在他们的研究中使用了疾病问题、入学问题等贝叶斯推理任务,他们发现被试在这两类问题上的推理成绩并没有表现出显著差异,即贝叶斯推理问题不存在内容效应(efect of content)。但有研究者认为,人们对入学考试和医学检查的结果都比较信赖,因此,以考试结果预测录取率和以检查结果预测患病率一样具有权威性,仍然可以用代表性启发法进行推断。研究者自行编制了“作家问题”,将贝叶斯问题中的事件与特征换成了作家和影迷。影迷与作家之问并不像阳性与疾病之间那样存在着关联,因此不能用代表性启发法进行推断。他们将作家问题与疾病问题进行对比研究,发现在同样的基础概率、击中率和误报率条件下,人们对作家问题的概率估计值显著低于疾病问题,并由此得出结论:贝叶斯推理中存在着内容效应。近年来,随着社会认知研究的兴起,越来越多的研究开始关注“热”认知的过程。张向阳等(2006)设计不同内容的问题研究了情绪、动机等因素对贝叶斯推理的影响。他们采用2(事件性质:积极事件/消极事件) ×2(事件与主体的关系:与主体有关/与主体无关)的混合设计进行实验,其中事件性质为被试内因素,事件与主体关系为被试间因素。研究发现被试对于消极事件的概率估计值显著低于积极事件,对与己有关的消极事件的概率估计值显著低于与己无关的消极事件 。由此可见,问题内容会导致被试在认知、情绪和动机等方面产生一定的倾向性,从而在不同程度上影响贝叶斯推理的结果。这与主观概率的支持理论是一致的,该理论认为:人类在不确定条件下的概率判断不符合外延性原则(extensionality principle)而是表现出描述依赖性,即对同一外延事件的不同描述所做出的主观概率不同。 信息格式(information format)指的是贝叶斯推理问题中概率数据的形式,包括数据的类型及其相互关系。早期研究中采用的数据大都是百分数形式,Gigerenzer和Hoffrage(1995)指出,从进化论角度来说,人类祖先在其进化环境中所遇到的信息形式是自然频数(natural irequencies)格式而不是近代才出现的概率和百分数形式,被试在某些问题中犯推理错误并不说明人类不能按照贝叶斯规则进行推理,而是由于问题的信息格式与人类的认知算法规则不一致造成的。他们用自然频数的信息格式,对乳腺癌问题中的概率信息进行如下表述:每1000名妇女中有10名患有乳腺癌(对应于1%的基础概率)。在患有乳腺癌的10名妇女中,有8名妇女胸透片呈阳性(对应于80%的击中率)。未患乳腺癌的990妇女中,有95名胸透片呈阳性(对应于9.6%的误报率)。研究发现:在自然频率形式条件下,46%的判断符合贝叶斯定理,而概率条件下只有16%的判断符合贝叶斯定理。因此他们认为,采用自然频数的信息格式可以帮助人们在无需刻意指导的情况下按照贝叶斯规则进行推断 。Cosmides和Tooby(1996)同意Gigerenzer和Hoffrage的生态与进化观点,并通过进一步的研究支持了他们的理论{“1。Sedlmeier等(2001)也认为自然频数格式更符合人类的信息表征方式,他们采用相应的“频数树”(Frequency Tree)方法对人们的贝叶斯推理能力进行训练,并认为该方法可以使人们更快的学会使用贝叶斯推理规则,其效果优于“概率树”(Probability Tree)训练法 。Lewis和Keren(1999)认为,自然频数格式下的乳腺癌问题改变了两个因素:一是,数据形式由概率变为频数;二是,信息取样方式由条件式(conditiona1)变为结合式(joint)。他们提出了条件式频数的信息表征方式:每1000名妇女中有10名患有乳腺癌(对应于1%的基础概率)。在患有乳腺癌的妇女中,每1000人中有800名妇女胸透片呈阳性(对应于80%的击中率)。未患乳腺癌的妇女中,每1000人有96人胸透片呈阳性(对应于9.6%的误报率)。研究发现,被试在该条件下的正确率为4%,显著低于结合式频率(即自然频率)条件下的30%。因此他们认为被试成绩的提高不是因为数据形式由概率变为了频数,而是信息由条件式变为了结合式。Mellers和McGraw (1999)则认为,频数和结合式都可以改进贝叶斯推理,哪种条件占优势取决于事件的性质。频数格式比概率格式更有利于人们对稀有事件的理解,此类问题中,频数格式更容易提高被试的成绩;结合式有助于人们建立适宜的心理模型(mental models),一般性事件中,他的优势会更加明显 。Fiedler等(2000)也对Gigerenzer和Hoffrage的研究提出质疑,他们认为自然频数格式一方面将数据形式由概率变为频数,另一方面也将参照尺度(reference scale)由不一致变为了一致。自然频数格式中,所有信息都是来自同一个1000人的样本,有着一致的参照尺度,数据之间可以进行直接的比较和计算,因此推理显得容易。他们通过实验研究发现,无论哪一种数据形式,只要参照尺度一致,被试进行推理的成绩都比较好。由此同样证明了频数并不是成绩提高的关键。Girotto和Gonzalez(2001)认为是提问形式和信息结构共同影响了推理成绩。自然频数的表述中,不仅是将概率数据变成了频率数据,而且还将提问形式由一步变成了两步(...人中有...人),将信息结构由未分割数据变为了分割数据(partitioned data)。所谓分割结构数据就是将1000分割为了10和990两部分,又从10中分割出8,从990中分割出95。他们通过实验考察了提问形式、信息结构以及数据类型等因素,结果发现,无论在概率还是频数格式下,两步提问的贝叶斯推理的成绩优于单步提问的成绩,具有分割的信息结构的问题成绩优于不具有分割信 结构的问题。以上关于贝叶斯推理的信息格式的研究和争议最初是源于Gigerenzer和Hofrage提出的自然频数理论。但后来的研究者似乎误解了他们的原意,主要是在“频数”上作争论,而忽视了“自然”的意义。Gigerenzer和Hofrage强调,他们所说的频数并非任意形式下的频数,而是通过自然取样获得的自然频数。因为自然频数携带了有关基础比率的信息,所以简化了贝叶斯计算。很显然,他们所说的“自然频数”就是Lewis和Kere所说的“结合式频数”、Fiedler等所说的“一致性参照尺度下的频数” 以及Girotto和Gonzalez所说的“分割结构的频数”。这些研究者都同意,该方式下推理会变得简单。但频数是否能起到作用呢?Gigerenzer和Hofrage不同意其他研究者的观点,他们通过考察“结合式频数”和“结合式概率”两种条件,发现前者的成绩明显好于后者。但Fiedler等(2000)的研究表明,这两种条件下,被试成绩的差异是不显著的 ,这可能与两种研究使用了不同的表述方式有关。总的来说,信息格式中所包括的数据类型和结构都会对贝叶斯推理的成绩产生影响,其中后者的作用更为明显。 除了问题本身的内容、信息格式和呈现方式等因素之外,推理者的知识、经验以及思维方式等因素也会影响贝叶斯推理问题的解决。张向阳等(2006)认为,医务人员之所以对人患病的概率作出高估,可能正是他们的医学经验在起作用。另一方面,如果被试具备相关的概率知识,则可能会促进贝叶斯推理问题的解决。研究者以被试的知识背景为自变量,用专家(有概率知识的数学系大学生)和新手(无概率知识的其他系大学生)进行对比实验。研究表明:在贝叶斯推理中,专家的概率知识背景有助于他们运用贝叶斯规则进行推理,概率估计准确性明显好于新手。这一结论与史滋福等(2006)的研究结果有所不同,他们以数学系和中文系的大学生为被试进行实验,发现两者之问概率估计的准确性没有显著差异。研究者认为,文理科被试之间并不存在所谓的思维类型不同而导致复杂概率推理成绩差异的现象。傅小兰等(2005)在考察不同信息表征方式对贝叶斯推理的影响时发现,中外被试在某些条件下的表现不同甚至相反。在Girott0和GonZalez的研究中,被试解决两步问题的成绩总是优于解决一步问题的成绩。而傅小兰等的研究却表明:对于中国被试而言,两步问题形式并不能改进他们解决贝叶斯推理问题的成绩,甚至在某些情况下还会干扰他们做出正确的回答。研究者认为,这可能在一定程度上反映了东西方人的不同思维风格和特点:对西方人而言,分析性的思维操作有助于他们顺利解决贝叶斯推理问题,而中国被试面对贝叶斯推理问题时则更倾向于整体性解决,因此,他们解决两步问题与解决一步问题的成绩之间没有出现显著差别,甚至解决一步问题的表现可能还会更好一些。另外,问题提问信息格式对中国被试解决贝叶斯推理问题也有影响,与概率格式相比,频数格式可以显著改善两步问题的贝叶斯推理成绩。这也与Girotto和Gonzalez的研究结果也不一致。后者的研究结果表明,问题提问的信息格式不影响被试解决贝叶斯推理问题的成绩。研究者认为,这可能也是由于东西方人思维方式的差异造成的。