【概率论】理解贝叶斯(Bayes)公式:为什么疾病检测呈阳性,得这种病的概率却不高?

article/2025/9/16 21:00:37

先说结论:因为假阳性的人数相比于真阳性太多了
具体是怎么回事呢?咱们慢慢分析。

文章目录

  • 一、贝叶斯公式
  • 二、典例分析
  • 三、贝叶斯公式的本质思考(摘自教材)

一、贝叶斯公式

定理1(贝叶斯公式) 设有事件 A , B A,B A,B P ( A ) > 0 P(A)>0 P(A)>0 P ( B ) > 0 P(B)>0 P(B)>0,则 P ( B ∣ A ) = P ( B ) P ( A ∣ B ) P ( A ) P(B|A)=\frac{P(B)P(A|B)}{P(A)} P(BA)=P(A)P(B)P(AB)证明:由条件概率的定义 P ( C ∣ D ) = P ( C D ) P ( D ) P(C|D)=\frac{P(CD)}{P(D)} P(CD)=P(D)P(CD)可知 P ( B ) P ( A ∣ B ) = P ( A B ) P(B)P(A|B)=P(AB) P(B)P(AB)=P(AB) P ( A B ) P ( A ) = P ( B ∣ A ) \frac{P(AB)}{P(A)}=P(B|A) P(A)P(AB)=P(BA)

定理2(含全概率公式的贝叶斯公式)若事件 B 1 , B 2 , ⋯ , B n , ⋯ B_1,B_2,\cdots,B_n,\cdots B1,B2,,Bn,构成互斥完备事件群,且对于任意 i = 1 , 2 , ⋯ i=1,2,\cdots i=1,2, P ( B i ) > 0 P(B_i)>0 P(Bi)>0,则对于任意事件 A A A P ( A ) > 0 P(A)>0 P(A)>0),有 P ( B i ∣ A ) = P ( B i ) P ( A ∣ B i ) ∑ j P ( B j ) P ( A ∣ B j ) P(B_i|A)=\frac{P(B_i)P(A|B_i)}{\sum\limits_jP(B_j)P(A|B_j)} P(BiA)=jP(Bj)P(ABj)P(Bi)P(ABi)证明提要:由全概率公式有 P ( A ) = ∑ j P ( B j ) P ( A ∣ B j ) P(A)=\sum\limits_jP(B_j)P(A|B_j) P(A)=jP(Bj)P(ABj),然后代入定理1即可。

二、典例分析

现在我们考虑标题中提出的问题。

某个地区患有一种疾病的占 0.05 % 0.05\% 0.05%,患者对某种检测结果呈阳性的概率为 0.99 0.99 0.99,正常人对这种检查呈阳性的概率为 0.005 0.005 0.005,问检测结果呈阳性的人得这种并的概率是多少?

记事件 A A A为患有此疾病, B B B为检测结果呈阳性,则 A ˉ \bar A Aˉ为未患有此疾病。
根据题意, P ( A ) = 0.0005 P(A)=0.0005 P(A)=0.0005 P ( A ˉ ) = 0.9995 P(\bar A)=0.9995 P(Aˉ)=0.9995 P ( B ∣ A ) = 0.99 P(B|A)=0.99 P(BA)=0.99 P ( B ∣ A ˉ ) = 0.005 P(B|\bar A)=0.005 P(BAˉ)=0.005
显然 A A A A ˉ \bar A Aˉ构成互斥完备事件群。
根据定理2,有 P ( A ∣ B ) = P ( A ) P ( B ∣ A ) P ( A ) P ( B ∣ A ) + P ( A ˉ ) P ( B ∣ A ˉ ) = 0.000495 0.000495 + 0.0049975 ≈ 0.0901 P(A|B)=\frac{P(A)P(B|A)}{P(A)P(B|A)+P(\bar A)P(B|\bar A)}=\frac{0.000495}{0.000495+0.0049975}\approx0.0901 P(AB)=P(A)P(BA)+P(Aˉ)P(BAˉ)P(A)P(BA)=0.000495+0.00499750.0004950.0901即检测结果呈阳性,得病的概率只有 9.01 % 9.01\% 9.01%

按理来说,这种检测其实是相当精准的(得病的对这种检测结果呈阳性的概率高达 99 % 99\% 99%,未得病的呈阳性的概率只有 0.5 % 0.5\% 0.5%),那为什么会出现这种结果呢?

我们分析一下 P ( A ∣ B ) P(A|B) P(AB)的式子。 P ( A ) P ( B ∣ A ) P(A)P(B|A) P(A)P(BA)是得病且呈阳性的概率, P ( A ˉ ) P ( B ∣ A ˉ ) P(\bar A)P(B|\bar A) P(Aˉ)P(BAˉ)是未得病且呈阳性的概率,所以 P ( A ∣ B ) P(A|B) P(AB)就是得病且呈阳性的概率占总的呈阳性的概率的比例。

为了更具体地讨论,我们用人数来说话。假设当地有一百万( 1000000 1000000 1000000)人,则得病的有 500 500 500人,得病且呈阳性的有 495 495 495人,正常人呈阳性的有 4997.525 4997.525 4997.525人(按 4998 4998 4998人来计算)。表示成图就是这个样子:
在这里插入图片描述
呈阳性的情况下得病的概率是多大呢?现在我们仅把目光聚焦在呈阳性的人里面:
在这里插入图片描述
为方便比较,我们把“得病且呈阳性”的部分旋转:
在这里插入图片描述
呈阳性且得病的几率就是得病且呈阳性的人数占所有呈阳性的人数的比例: 495 495 + 4998 ≈ 9 % \frac{495}{495+4998}\approx9\% 495+49984959%

所以,虽然正常人呈阳性的概率很小,但是正常人和得病的人数相比实在是太多了,导致正常人呈阳性的也非常多,“冲淡了”呈阳性的人得病的几率。相比之下,得病且呈阳性的人实在是少得可怜。因此,我们就解释了为什么虽然检测结果呈阳性,得这种病的概率却不高。

既然如此,做这种检测还有意义吗?还是有的,因为做之前一个人得病的几率为 0.05 % 0.05\% 0.05%,做了且呈阳性之后得病的几率骤增到了 9 % 9\% 9%,上升了 180 180 180倍。当然,医院里面检测一个疾病要用很多种检测手段,这样就能一步步排除假阳性的情况了。

三、贝叶斯公式的本质思考(摘自教材)

在这里插入图片描述
在这里插入图片描述


http://chatgpt.dhexx.cn/article/UeB2pTcK.shtml

相关文章

全面梳理:准确率,精确率,召回率,查准率,查全率,假阳性,真阳性,PRC,ROC,AUC,F1

二分类问题的结果有四种: 逻辑在于,你的预测是positive-1和negative-0,true和false描述你本次预测的对错 true positive-TP:预测为1,预测正确即实际1 false positive-FP:预测为1,预测错误即实…

imputation-文献:False signals induced by single-cell imputation(scRNA-seq插补引入的假阳性问题)

文章题目 False signals induced by single-cell imputation 中文名: 单细胞插补引起的假信号 文章地址: https://f1000research.com/articles/7-1740/v2 评价插补方法: SAVER,DrImpute,scImpute,DCA,MAGIC,knn-smooth 上述方法基于原…

混淆矩阵、召回率、精确率、正确率、F1、真阳性率、假阳性率、ROC、AUC

C o n f u s i o n M a t r i x : Confusion Matrix: ConfusionMatrix: 真实 1 0 预测 1 TP(命中) FP(虚报) 0 FN(漏报) TN(正确拒绝) 召回率 R e c a l l T P T P F N Recall \dfrac{TP}{TP FN} RecallTPFNTP​,关注真实情况,关注positive。“好瓜被…

准确率,召回率,mAP,ROC,AUC,特异性,敏感性,假阴性,假阳性

P/R和ROC是两个不同的评价指标和计算方式,一般情况下,检索用准确率、召回率、F1、AP和mAP,分类、识别等用ROC和AUC(特异性和敏感性是ROC当中的一个部分)。 准确率、召回率、F1、AP和mAP这几个指标需要依次看&#xff0…

扩增子测序引入的假阳性稀有类群干扰对微生物群落多样性、构建机制及相互作用的研究...

# 01 2022年8月17日,青岛华大基因研究院、深圳华大生命科学研究院联合中国农业科学院北京畜牧兽医研究所、山东大学微生物技术国家重点实验室、丹麦哥本哈根大学等单位在 Environmental Microbiome (IF 6.36) 上发表了题为 “Sequencing introduced false positive …

敏感性、特异度、α、β、阳性预测值(PPV)、阴性预测值(NPV)等指标及置信区间计算(附R语言代码)

这个虽然简单但老是被绕进去,所以整理一下方便查阅。 首先画一个22的混淆矩阵confusion matrix: TP = True positive(真阳性) FP = False positive (假阳性) FN = False negative(假阴性) TN = True negative(真阴性) 敏感性(sensitivity)= 真阳性率 = 真阳/实…

真阳性假阳性假阴性分割可视化

1.分割掩码二值化 分割掩码转化为图像格式时会在分割边界处有很多灰度像素点,这将导致后续利用分割掩码和预测分割掩码进行处理时会在边界处出现很多噪声点,因此利用阈值将分割掩码转换为二值图,消除边界上的灰度像素点。 代码 import nump…

(精确度,召回率,真阳性,假阳性)ACC、敏感性、特异性等 ROC指标

1、概念 金标准(标准集) 预测算法(预测集) 验证存在(T) 验证不存在(F) 合计 预测存在(P) 预测为正,真实为正(TP) …

fNIRS中的假阳性和假阴性:问题、挑战和方法

导读 本文强调了在进行功能性近红外光谱(fNIRS)研究时需要考虑和解决的一个重要问题,即无意中测量非神经血管耦合引起的fNIRS血流动力学反应的可能性。这些可能被误解为大脑活动,即“假阳性”(由于错误地将检测到的血流动力学反应分配给功能性大脑活动而…

精确度、召回率、真阳性、假阳性

1) 精确度( precision ):TP / ( TPFP ) TP / P 2) 召回率(recall):TP / (TP FN ) TP / T 3) 真阳性率(True positive rate):TPR TP / ( TPFN ) TP / T (敏感性 sensiti…

每天五分钟机器学习:如何计算模型的假阳性率和真阳性率?

本文重点 如上所示,我们学习了查准率和召回率,本文我们将学习真阳性率和假阳性率,学会这个对将来构建ROC曲线非常有帮助 真阳性率和假阳性率 假如使用测试集来评估一个分类模型(二分问题):所以样本实际值…

统计学中的真阳性(TP),假阴性(FN),假阳性(FP),真阴性(TN)怎么理解?

举个例子,假如要在一个地区进行1000人的疾病检测,我们站在上帝视角,知道这1000人中,有10人是疾病感染者,占比1%。 但实际的检测结果可能存在误差,误差包括两种情况 疾病感染者,被错误诊断为健康身体健康,但却被错误诊断为感染者对应了两种情况 检测出来的是阴性,就一…

敏感性、特异性、假阳性、假阴性

敏感性、特异性、假阳性、假阴性是医学领域常用的评估指标。 敏感性:在金标准判断有病(阳性)的人群中,检测出阳性的几率。真阳性(检测出确实有病的能力) TPR TP / ( TPFN ) TP / T 特异性:在金…

ADODB简介

ADODB简介 ADODB 是 Active Data Objects Data Base 的简称,它是一种 PHP 存取数据库的函式组件。现在 SFS3 系统 (校园自由软件交流网学务系统) 计划的主持人陈莹光老师,决定采用此一组件,为了让更多有心参与该项目的伙伴们能够顺利加入发展…

Padavan固件添加adbyby去广告功能

2019独角兽企业重金招聘Python工程师标准>>> 在路由-》自定义脚本》wan上下行启动后执行,添加下面脚本 #!/bin/shsleep 30###Adbyby去广告脚本### Adbyby1 ### 0关闭;1启动 ########以下脚本请勿更改##### if [ "$Adbyby" "0…

newifi mini php,WBB - Newifi mini刷小米路由mini固件 + 屏蔽广告Adbyby插件小记

17号在京东下单Newifi mini,99块,当时还觉得很神奇,下午3点的单,居然晚上7点就到了。和同类产品小米路由mini的官网缺货以及130价格完全不是一回事,但据说他们的硬件却基本一致。 到手开箱使用,一看界面还不…

adb host 和 adbd

1、在HOST端,adb会fork出一个守护进程(不是adbd),即server,而父进程继续处理client请求,所有的client通过TCP端口号5037进行与server通信,而server创建local socket与remote socket,…

2017-06-11 Padavan 完美适配newifi mini【adbyby+SS+KP ...】youku L1 /小米mini

源地址 http://www.right.com.cn/forum/thread-199452-1-1.html 最新固件通知地址: http://p4davan.80x86.io/tags/firmware/ (建议加入浏览器收藏) 2017-02-20 群里有朋友提供了L1硬件,新增加 适配 youku L1(L1C也可以),在这里可以下载&am…

2022自编译最新稳定版newifi3固件

仅添加了自己常用的功能,具体如下。另外还有一些注意事项,请务必阅读 另:2022版本与之前版本不通用,如需升级请清除数据或仅备份部分overlay文件,在刷入后覆盖 功能(针对最新版) 计划任务挂载点…

2021自编译NEWIFI3最新openwrt固件

仅添加了自己常用的功能,具体如下。另外还有一些注意事项,请务必阅读 另:2021版本与之前版本不通用,如需升级请清除数据或仅备份部分overlay文件,在刷入后覆盖 功能(针对最新版) 计划任务LED配…