自由的投资

自由的投资和写作

首页文章列表博文目录

个人资料

李广东

给我悄悄话

博客访问：

形式逻辑对于贝氏定理的解释以及意义上的启发

(2024-02-02 06:48:08) 下一个

形式逻辑对于贝氏定理的解释以及意义上的启发

现状

国内对贝氏定理，作了各种各样的讲解。给人启发。

但是，贝氏定理公式涉及形式逻辑推理的分析，以贝氏定理解决问题的方式，多是以记忆公式来解决问题，道理并不简单明了。在相关的教学中，我还没有发现有简单明了的解释。

本文试着从形式逻辑角度给予解释，以解决人们在理解和应用贝氏定理公式方面的困扰。

本文的结构是，先以例子说明它在现实方面的应用。引出其数学公式所表达的，看起来与现实意义方面的不合理之处。再以形式逻辑解释之。

例：新冠患者检测

下面展示贝叶斯定理在新冠病毒检测时的应用。

假设某个试剂的检测结果的灵敏度和差异度均为99%，即新冠患者每次检测呈阳性（+）的概率为99%。而非新冠患者每次检测呈阴性（-）的概率为99%。

已知0.5%的雇员感染新冠病毒。

请问每位检测结果呈阳性的雇员染病的概率有多高？

解：

符号记作，检测结果呈阳性，为+；染病毒为D。所求的结果写作：P(D|+)。它是每位检测结果呈阳性的雇员染病毒的概率表达。

已知的值：

从已知0.5%的雇员染病毒知，不设任何条件，某公司新冠患者的概率P(D)=0.005。0.5%是怎么已知的？合理的推测是，根据以前的，或者，其它公司的数据，所做的猜想。注意，它不来自公司本身，因为，如果这数据来自公司本身，题目的问题没有了意义。因此，这种“已知”的信息，也叫做先验信息。

在染病毒条件下，被检测呈阳性的概率P(+|D)=0.99

请注意区别，P(+|D)与P(D|+)的形式不同，含义也不同。

以上，

“不论条件”，皆呈阳性的概率P(+)=0.005*0.99+0.995*0.01=0.015。白话来说，即该公司有多少比例的雇员，其检测结果为阳性。

根据贝叶斯定理：

1.P(+)P(D|+)=P(D)P(+|D)

2.P(D|+)=P(D)P(+|D)/P(+)=0.005*0.99/0.015 =0.332

这里贝叶斯定理公式1.所表达的意义为：无论条件，被测为阳性的概率，“并且（以及）”，在被测为阳性的条件下，染病毒的概率，等于，无论条件，染病毒的概率，“并且（以及）”，在染病毒条件下，被测为阳性的概率。

这里贝叶斯定理公式2.从各式的数值可得它的答案0.332。答案的意义可描述为，在被测为阳性的条件下，染病毒的概率是0.332。

结果说明什么？你猜想过吗？

从试剂的检测结果（99%）来看，是比较准确的，但是贝叶斯定理却可以揭示一个潜在的问题，在被测为阳性的条件下，“真正”染病毒的概率，并没有我想象的那样高，与我从直觉得出的结论相差太大。你想象过吗？

进一步分析这个例子，有一种看法就是证据的有效性。

P(+|D)=0.99，作为染病毒的证据的准确性（或称之为，准确的可能性）很高了。即使很高，仍然还要取决于“真正”新冠患者的群体的大小，即P(D)=0.005。如果很小，证据的有效性（注意，不是“准确性”）会被大打折扣，即结果P(D|+)的影响并不著显，反而显得证据是无能为力（仅为0.332）。这一事实表明，证据的“准确性”是证据本身的特征；而证据“有效性”，则描述了某种关系的性质，也就是，它描述证据与结论之间的关系特性。这两个形容词应用的场景不一样。这种“不一样”的区分，具有哲学意义，即“准确性”描述“事物”是什么？而“有效性”描述“事实之间”的关系。比如，任何事实之间有因必有果的理性（reason）关系。

显而易见，这取决于参数P(D)/P(+)的大小，极端情况是，若参数=1,二者一样，也可以说，完全相似。而分析P(D)/P(+)易知，其中，P(D)是先验概率，这取决于这个公司的群体是否具有典型性，比如，与社会群体染病的一致性，偏差大，还是小。而其中的P(+)=0.005*0.99+0.995*0.01又受到P(D)的影响。重新展现这个参数，是这样的：

P(D)/P(+)=0.005/(0.005*0.99+0.995*0.01)

你可以通过对其中P(D)做从小到大的测试。容易知道，P(D)向1,P(D|+)与P(+|D)二者更加具有似然性。

我理解的意思是，要找到那个先验可能性比较大的群体，这时，证据的“准确性”才接近“有效性”。

这给我们的启示是什么呢？通常人们以证据的高准确性直接作有效性推理，这也许符合“直觉”，然而，这种“直觉”并不常常正确。

这可以解释社会上许多现象，比如，“成功学”大多无效。你可以解释一些社会现象吗？

比如，勤奋对于成功者来说，有人说，可以看到大多数成功者都很勤奋。于是，得出结论，只要勤奋为条件，那么，就有可能成功。但是，这个结论忽略了，成功人士的群体太小了，比如，马云及其成功的事实，是社会上，极少数人及其成功的事件。因此，勤奋对于想获得马云这样成功的人来说，证据的有效性就很差。

类似的模型很多。又如，高中生普遍拟通过做对高考模拟题，期望获得好成绩。然而，容易测算，每年高考题与模拟题的一致性极低，即使我们所模仿的都对，也就是“证据”的准确性极高，期望也不容易实现。结论是，以大量的模拟题训练，并不是有效的路径。这与直觉不一致。

顺便说，如果我们从成功人士的做法上，受到启发；从高考题目的解答中，受到启发，是另一回事。这跟单纯地模仿不同。他们的任何成功的思想、行为方式的典型特征与我们所处的时空场景很难具有一致性，同时，对于我们想要的成功，也不具有效性。可怜。

进一步分析，

P(+)P(D|+)=P(D)P(+|D)=P(+^D)

意思是，检测为阳的概率，并且，在被检为阳性的条件下，确是染病毒的概率等于

染病毒的概率，并且，在染病毒条件下，被检出阳性的概率

二者都等于：被检为阳和染病毒同时发生的概率

叶斯定理的公式所要表达的事实意义是明确的。

我有问题是，

P(D|+)=P(+^D)？意思是，在被检为阳性的条件下，确是染病毒的概率。为什么不等于“被检为阳和染病毒同时发生的概率”？

或者，为什么不可以P(D|+)=P(D)P(+|D)？

从直觉，总觉得，没有不可以。

从形式逻辑上，很容易推理出，不可以。

因为，分析如下：

1被检为阳染病毒

2被检为阳不染病毒

3被检为非阳不染病毒

4被检为非阳染病毒

有四种关系。举不出更多。

分析P(D|+)，陈述为：“在被检为阳性的条件下，确是染病毒的概率。” 这个陈述句为一个条件句。

从形式推理的原则，只要“染病毒”为真，无论条件如何，这个推论即为真。

对比以上四种关系，应该很容易指出是上述哪个关系，即1，4，对吗？

当+^D时，即当“被检测为阳”跟“染病毒”，作乘积，求概率P(+^D)时，这意味着，被检测为阳，在这个陈述中，确保是真的。由此，在推理上，即明确了（被检为阳性的）条件为真。在此真的前提条件下，染病毒为真。这个推论才为真。对比，P(D|+)的含义及推理，显然，P(D|+)陈述所得出结论的条件，要比 P(+^D)得出结论的条件，宽泛得多。

再重述一遍：P(D|+)，只要“染病毒”为真，无论条件如何，这个推论即为真。

而P(+^D)，则染病毒为真，则明确要求了（被检为阳性的）条件为真，这个陈述为真。

简言之，P(D|+)与P(+^D)二者陈述所得出的结论相同，而“条件”不同。因此，不是同一陈述。不可代换。

也就是说，P(D|+)=P(+^D)不成立，当然，P(D|+)=P(D)P(+|D)也不成立。

我觉得，先有形式逻辑的思想基础，才有条件概率公式的发展。任何抛开形式逻辑的思想，单纯作公式推导，是不理解条件概率本质的记忆游戏。

[ 打印 ]

[ 加入书签 ]

阅读 () ┆ 评论

目前还没有任何评论

登录后才可评论.