机器学习之条件概率,联合概率,贝叶斯定理详解

article/2025/9/19 23:33:57

文章目录

    • 前言
    • 边缘概率
    • 联合概率
      • 定义
      • 分析
    • 条件概率
      • 定义
      • 问条件概率能举个例子吗
      • 问条件概率在图中表示的是哪一块呢?
      • 条件概率习题:
    • 全概率
      • 定义
      • 推导
      • 全概率习题
    • 贝叶斯公式
      • 定义
      • 推导
      • 贝叶斯定理习题
    • 结束语

前言

条件概率,边缘概率,联合概率,全概率,贝叶斯定理是机器学习中几乎所有算法的基础,虽然公式记住了,但是为什么是这样,以及如何理解看过之后隔一段时间问题忘,这里在这里好好做下总结

边缘概率

边缘概率是与联合概率相对应的, P ( A ) P(A) P(A) P ( B ) P(B) P(B)这类仅与单个随机变量有关的概率称为边缘概率。
边缘概率是不用求的,一般都会给出。

条件概率是由联合概率反推出来的,理解起来没有那么直观,全概率,贝叶斯定理也是由联合概率推导出来的,所以这里先说联合概率再说条件概率,最后再讲贝叶斯定理。

联合概率

定义

指包含多个条件且所有条件同时成立的概率,记作 P ( A , B ) P(A, B) P(A,B),或 P ( A B ) P(AB) P(AB) P ( A ∪ B ) P(A \cup B) P(AB),不过一般都是写成 P ( A , B ) P(A, B) P(A,B)

分析

事件A和事件B可以相互影响的,不过也可以相互独立,不过没有讨论的意义。
机器学习之条件概率_联合概率_贝叶斯定理_01.png
如上图
绿色的椭圆表示事件A发生的概率 P ( A ) P(A) P(A)
橘红色的椭圆表示事件B发生的概率 P ( B ) P(B) P(B)
A和B相交的部分就是 P ( A , B ) P(A,B) P(A,B)发生的概率

其中
P ( A ) P(A) P(A) P ( B ) P(B) P(B)都是边缘概率
P ( A , B ) P(A,B) P(A,B)就是联合概率

于是我们可以很
可以看到事件A发生的概率和事件B相交的部分就是 P ( A , B ) P(A,B) P(A,B)

然后我们也就很容易理解
P ( A , B ) P(A,B) P(A,B)发生的概率就是:
事件B发生的概率,乘以事件A在事件B发生的条件下发生的概率,
于是有: P ( A , B ) = P ( B ) P ( A ∣ B ) P(A,B) = P(B) P(A|B) P(A,B)=P(B)P(AB)

其中 P ( A ∣ B ) P(A| B) P(AB)就是事件B发生的情况下事件A发生的概率就是条件概率,记为 P ( A ∣ B ) P(A|B) P(AB),下文会继续讲到。

条件概率

定义

已知事件A发生的条件下,另一个事件B发生的概率称为条件概率,即为: P ( A ∣ B ) P(A|B) P(AB)

事件A和事件B是相互影响的。更通俗地说事件A与事件B是有关系的,发生事件A会影响发生事件B发生的概率。

问条件概率能举个例子吗

学生时代两个人竞选班,同学A赢的概率是0.6,同学B赢的概率是0.4,问同学A在同学B先被投票的情况下赢的概率是多少。
心理学上有种先入为主的现象,不管是谁,第一个被投票的往往比第二个得票更多一些,就这就是两个事件相互影响,这就是条件概率

问条件概率在图中表示的是哪一块呢?

答:条件概率 P ( A ∣ B ) P(A|B) P(AB)在图中表示不出来, P ( A , B ) P(A,B) P(A,B) P ( B ) P(B) P(B)都是以图形的形式表示概率的, P ( A ∣ B ) P(A|B) P(AB)则是 P ( A ∣ B ) P(A|B) P(AB) P ( A , B ) P(A,B) P(A,B)除以 P ( B ) P(B) P(B)的比值,在图形上表示不出来。
条件概率毕竟还是有些抽象滴。。。要不然也不会主要求它啊(_

P ( A ∣ B ) P(A|B) P(AB)是通过联合概率反推出来的,以图形化的方式表示自然没有那么直观,不过以联合概率反推的方式来解理还是很好理解的,参考联合概率

OK,到这里来道习题加深下理解吧

条件概率习题:

1 , 2 , 3 , … , 15 1,2,3,\ldots ,15 12315中甲乙两人各任取一个数字(不重复),已知甲取到的数是5的倍数,求甲数大于乙数的概率。

解:
设事件A表示”甲取到的数比乙大“,即 P ( A ) P(A) P(A)
设事件B表示”甲取到的数是5的倍数”,即 P ( B ) P(B) P(B)
则显然所要就是条件概率 P ( A ∣ B ) P(A|B) P(AB)
根据公式
P ( A ∣ B ) = P ( A , B ) P ( B ) P(A|B) = \frac{P(A,B)}{P(B)} P(AB)=P(B)P(A,B)

而:
P ( B ) = 3 15 = 1 5 P(B) = \frac{3}{15} = \frac{1}{5} P(B)=153=51

P ( A , B ) = C 4 1 + C 9 1 + C 14 1 C 14 1 C 15 1 = 9 / 70 P(A,B) = \frac{C^1_4 + C^1_9 + C^1_{14}}{C^1_{14}C^1_{15}} = 9 / 70 P(A,B)=C141C151C41+C91+C141=9/70


P ( A ∣ B ) = P ( A , B ) P ( B ) = 9 70 P(A|B) = \frac{P(A,B)}{P(B)} = \frac{9}{70} P(AB)=P(B)P(A,B)=709

所以 P ( A ∣ B ) = 9 14 P(A|B) = \frac{9}{14} P(AB)=149

通过这么一个例子,理解起来是不是更深入了?
我们可以发现:

  1. P ( B ) P(B) P(B)是边缘概率,是直接可以求出来的,
  2. P ( A ) 与 P ( B ) P(A)与P(B) P(A)P(B)是相互影响的,
  3. P ( A , B ) P(A,B) P(A,B)是联合概率通过复杂些的计算也是可以求出来的,
    但是条件概率P(A|B)则比较抽象,没那么容易求出来,

OK,现在知道了条件概率的意义了吧

全概率

定义

联合概率中把事件A分割成事件 A 1 , A 2 , A 3 , ⋯   , A n A_1,A_2,A_3, \cdots, A_n A1A2A3,,An,并把A与B的位置对调于是就成了全概率,如下图
机器学习之条件概率_联合概率_贝叶斯定理_02.png

推导

只是全概率是求事件B的,
全概率需要满足以下条件:

  1. 事件A1到An是相互独立的
  2. 事件A1到An组成了整个样本空间A
  3. 事件A1到An能把事件B无重叠地覆盖掉

如上图,事件B发生的概率是由C1~C6组成的,于是有:
P ( B ) = P ( C 1 ) + P ( C 2 ) + P ( C 3 ) + P ( C 4 ) + P ( C 5 ) + P ( C 6 ) P(B) = P(C_{1}) + P(C_{2}) + P(C_{3}) + P(C_{4}) + P(C_{5}) + P(C_{6}) P(B)=P(C1)+P(C2)+P(C3)+P(C4)+P(C5)+P(C6)
简化一下就是: P ( B ) = ∑ i = 1 6 P ( C i ) P(B) = \sum_{i=1}^{6}P(C_{i}) P(B)=i=16P(Ci)

P ( C i ) = P ( B ∣ A i ) P(C_{i}) = P(B | A_{i}) P(Ci)=P(BAi)
于是全概率公式就出来了
P ( B ) = ∑ i = 1 n P ( B ∣ A i ) P(B) = \sum_{i=1}^{n}P(B | A_{i}) P(B)=i=1nP(BAi)

注意啊,到全概率的时候A( A i A_{i} Ai)与B,的位置就反过来了,比如说
条件概率公式的表示形式是: P ( A ∣ B ) P(A|B) P(AB)
全概率公式的表示形式是: P ( B ∣ A i ) P(B|A_{i}) P(BAi)
好了,来道题吧:

全概率习题

某工厂有两个车间产生同一型号的配件,第一车间的次品率是 0.15 0.15 0.15,第二车间的次品率是 0.12 0.12 0.12,两个车间的成品都混合堆放在一直,假设第1,2车间生产的成品比例为 2 : 3 2:3 2:3,现有一客户从混合成品堆里随机抽查一台产品,求该产品的合格率。
解:

事件B = {从仓库中随机抽查的产品的合格率}
事件A_{i} = {抽的是第 i i i车间产生的}, i = 1 , 2 i = 1, 2 i=1,2
于是
P ( B ) = ∑ i = 1 2 P ( A i ) P ( B ∣ A i ) P(B) = \sum_{i=1}^{2}P(A_{i})P(B| A_{i}) P(B)=i=12P(Ai)P(BAi)
由题意可知:
A 1 A_1 A1的边缘概率:
P ( A 1 ) = 2 5 P(A_{1}) = \frac{2}{5} P(A1)=52
A 2 A_2 A2的边缘概率:
P ( A 2 ) = 3 5 P(A_{2}) = \frac{3}{5} P(A2)=53
条件概率:
A 1 A_1 A1发生的情况下,B发生的概率:
P ( B ∣ A 1 ) = P ( B , A 1 ) P ( A 1 ) P(B|A_{1}) = \frac{P(B, A_{1})}{P(A_{1})} P(BA1)=P(A1)P(B,A1)

P ( B ∣ A 1 ) = 0.85 P(B|A_{1}) = 0.85 P(BA1)=0.85

A 2 A_2 A2发生的情况下,B发生的概率:
P ( B ∣ A 2 ) = P ( B , A 2 ) P ( A 2 ) P(B|A_{2}) = \frac{P(B, A_{2})}{P(A_{2})} P(BA2)=P(A2)P(B,A2)

P ( B ∣ A 2 ) = 0.88 P(B|A_{2}) = 0.88 P(BA2)=0.88

根据全概率公式可知:

P ( B ) = P ( A 1 ) P ( B ∣ A 1 ) + P ( A 2 ) P ( B ∣ A 2 ) P(B) = P(A_{1})P(B| A_{1}) + P(A_{2})P(B| A_{2}) P(B)=P(A1)P(BA1)+P(A2)P(BA2)

所以 P ( B ) = 0.868 P(B) = 0.868 P(B)=0.868

贝叶斯公式

定义

同样条件概率中把A推分割成 A 1 , A 2 , A 3 , ⋯   , A n A_1,A_2,A_3, \cdots, A_n A1A2A3,,An,并把A与B的位置对调就成了贝叶斯公式

推导

机器学习之条件概率_联合概率_贝叶斯定理_02.png
根据上图(没错,两个图是一样的,只是离得太远看着不方便)
我们可以知道:求事件B发生的情况下 A i A_i Ai发生的概率其实就是求: P ( C i ) P(C_i) P(Ci)
而根据条件概率我们可以知道:
P ( C i ) = P ( A i ∣ B ) = P ( B , A i ) P ( B ) P(C_{i}) = P(A_i | B) = \frac{P(B, A_{i})}{P(B)} P(Ci)=P(AiB)=P(B)P(B,Ai)

由全概率公式我们可以知道:
P ( B ) = ∑ j = 1 n P ( A j ) P ( B ∣ A j ) P(B) = \sum_{j=1}^{n}P(A_{j})P(B|A_{j}) P(B)=j=1nP(Aj)P(BAj)

于是我们最终得到贝叶斯定理的公式为(注意 i i i j j j的不同):
P ( A i ∣ B ) = P ( B , A i ) ∑ j = 1 n P ( A j ) P ( B ∣ A j ) P(A_{i}|B) = \frac{P(B, A_{i})}{\sum_{j=1}^{n}P(A_{j})P(B|A_{j})} P(AiB)=j=1nP(Aj)P(BAj)P(B,Ai)
同样来道习题

贝叶斯定理习题

某公路上经过的货车与客车的数量之比为 2 : 1 2:1 2:1,货车中途停车修理的概率为 0.02 0.02 0.02,客车为 0.01 0.01 0.01,现有一辆汽车中途停车修理,问该汽车是货车的概率
解:

事件 B B B = {中途停车修理}
事件 A 1 A_1 A1 ={经过的是货车},
事件 A 2 A_2 A2 ={经过的是客车},
于是事件B有: B = A 1 B ∪ A 2 B B = A_{1}B \cup A_{2}B B=A1BA2B

由贝叶斯公式有:
P ( A 1 ∣ B ) = P ( A 1 ) P ( B ∣ A 1 ) P ( A 1 ) P ( B ∣ A 1 ) + P ( A 2 ) P ( B ∣ A 2 ) P(A_{1} | B) = \frac{P(A_1)P(B|A1)}{P(A_1)P(B|A1) + P(A_2)P(B|A_2)} P(A1B)=P(A1)P(BA1)+P(A2)P(BA2)P(A1)P(BA1)

P ( A 1 ∣ B ) = 2 3 × 0.02 2 3 × 0.02 + 1 3 × 0.01 P(A_{1} | B) = \frac{\frac{2}{3} × 0.02}{\frac{2}{3} × 0.02 + \frac{1}{3} × 0.01} P(A1B)=32×0.02+31×0.0132×0.02

所以最后的结果为: P ( A 1 ∣ B ) = 0.80 P(A_{1} | B) =0.80 P(A1B)=0.80

结束语

OK,到这里边缘概率,联合概率,条件概率,全概率,贝叶斯定理就全部完了,不知道你有没有看明白,不明白的话可以提问啊,咱一块交流。


http://chatgpt.dhexx.cn/article/smrOuXGa.shtml

相关文章

概率论中的联合概率理解

最近在看信息论中的概念,对于联合熵的概念比较混乱,从而引发出对联合概率的思考, 当提到联合概率的时候大家都会看到这么一个图: 学习概率论是这样理解还可以,还能解释条件概率,总体挺好的; 但…

5分钟理解边缘概率,联合概率,条件概率,随机事件独立,随机事件依赖

在隐马尔可夫(HMM)和条件随机场(CRF)中有很多概率计算问题,要想理解他们,必须先把概率的一些概念及计算公式搞清楚。本文旨在用形象的图形和具体事例来讲解这些概念和公式,以帮助理解。这里讲的…

联合概率和条件概率的区别和联系

联合概率P(A∩B) 两个事件一起(或依次)发生的概率。 例如:掷硬币的概率是 ⁄₂ 50%,翻转 2 个公平硬币的概率是 ⁄₂ ⁄₂ ⁄₄ 25%(这也可以理解为 50% 的 50%) P(A ∩ B) P(A) ⋅ P(B) 对于 2 个硬…

联合概率和条件概率区别

为什么从定义上看,觉得联合概率和条件概率是一个意思? P(A|B) 和 P(AB) 这俩真的不是一个东西吗?? 碎碎念开始,正文请跳往第2分割线 虽然我产生了这种疑问,但我的直觉告诉我:大概是个傻逼。于…

联合概率(joint probability)、分布函数(distribution function)

0. PMF 与 PDF 的记号 PMF: PX(x) PDF: fX(x) 1. 联合概率 联合概率:是指两个事件同时发生的概率。 P(A,B)P(B|A)⋅P(A)⇒P(B|A)P(A,B)P(A) P(A,B)=P(B|A)\cdot P(A) ⇒ P(B|A)=\frac{P(A,B)}{P(A)}因此当两事件独立时, P(A,B)P…

条件概率和联合概率

表示两个事件共同发生百的概率。 A与B的联合概率表示为 P(AB) 或者P(A,B)&#xff0c;或者P(A∩B)。 在概率论中&#xff0c;联合概率是指在多元的概率分布中多个随机变量分别满足各自条件的概率。 举例说明&#xff1a;假设X和Y都服从正态分布&#xff0c;那么P{X<4,Y&l…

联合概率

在机器学习经常出现联合概率&#xff0c;总是困扰者我。因此记录一下 联合概率分布简称联合分布&#xff0c;是两个及以上随机变量组成的随机向量的概率分布。根据随机变量的不同&#xff0c;联合概率分布的表示形式也不同。 对于离散型随机变量&#xff0c;联合概率分布可以以…

条件联合分布的分解

前言 有挺长一段时间没有更新博客了&#xff0c;一方面是学校期末考试&#xff0c;后来又看了一些很基础的编程数学思想的东西&#xff08;《程序员的数学》第一卷&#xff09;&#xff0c;大多数东西都在之前的学习和使用中都有注意到&#xff0c;所以没有什么特别值得更新的…

概率统计篇:概率基础(联合概率、条件概率和贝叶斯法则)[第二天]

联合概率&#xff1a;由多个随机变量决定的概率我们就叫联合概率&#xff0c;它的概率分布就是联合概率分布。 边缘概率&#xff1a;对于离散型随机变量&#xff0c;我们可以通过联合概率 P(x, y) 在 y 上求和&#xff0c;就可以得到 P(x)。对于连续型随机变量&#xff0c;我们…

什么是联合概率分布?

联合概率分布简称联合分布&#xff0c;是两个及以上随机变量组成的随机向量的概率分布。根据随机变量的不同&#xff0c;联合概率分布的表示形式也不同。对于离散型随机变量&#xff0c;联合概率分布可以以列表的形式表示&#xff0c;也可以以函数的形式表示&#xff1b;对于连…

强迫症有哪些表现呢?

不知道大家有没有过这样的经历呢~ 明明自己已经把全部的电源开关都关了&#xff0c;可是当要出门的时候还是再检查很多遍。 有时候&#xff0c;已经出门了&#xff0c;还是忍不住回去检查很多次。 手已经洗干净了&#xff0c;但还是得再洗几遍&#xff0c;甚至洗破皮。 其实…

强迫症,是仅次于抑郁症、酒精依赖和恐惧症的第4个常见病

出门时总是当心门阀没锁、炉灶没关、狗狗没喂; 整理东西时经常纠结一些没用的东西该不该扔掉; 常常过度害怕细菌、化学物质&#xff0c;频繁地洗漱、清洁; 或者是在一件事情上需要重复多次检查...... 若出现这些情况&#xff0c;通常和你是什么星座没有关系&#xff0c;而是强迫…

疫情是否给你留下了强迫症

来源&#xff1a;中国数字科技馆 随着防疫进入常态化&#xff0c;人们的生活也趋于正常&#xff0c;但疫情期间养成的一些习惯并没有消除&#xff0c;比如&#xff0c;每隔一段时间就必须洗手&#xff0c;而且洗得特别仔细;随身携带消毒湿巾&#xff0c;无论接触什么都要先用湿…

被强迫症困扰十几年,如今它已没有机会折磨我

小行星的力量太渺小了&#xff0c;根本躲不过黑洞的引力。在强迫的黑洞面前&#xff0c;我只是沧海一粟的小行星。 01 时刻紧绷的神经 儿时的我是个较同龄人认真严肃许多的人。我会在睡前反反复复检查书包有没有收拾好&#xff0c;一遍遍翻作业本看有没有都写完&#xff0c;…

程序员的强迫症–如何让电脑桌面变得非常干净?

强迫症的程序员 朋友们&#xff0c;电脑桌面是不是一天比一天乱&#xff0c;很多人都喜欢在电脑桌面上放置好多文件和应用的快捷方式&#xff0c;一般电脑桌面的文件都是占用系统盘C盘的空间&#xff0c;如果电脑桌面文件越来越多会影响电脑的性能。因此尽量不要把大文件放在C盘…

如何克服熬夜强迫症,早睡早起

解除拖延症&#xff1a;如何克服熬夜&#xff0c;早睡早起 1、与睡眠相关的理论 睡眠阶段理论&#xff1a;入睡期间——轻度睡眠——深度睡眠——眼动期间有消耗才需要补充&#xff0c;消耗少则无需补充&#xff0c;不要一困就睡睡眠时长的相关理论&#xff1a;并不是睡眠时间…

最有效地戒掉晚睡强迫症(熬夜强迫症、假象失眠症等等)

熬夜的习惯最常出现在时间分配比较自由的年轻人中&#xff1a;大学生、待业者、自由撰稿人、网络作者、画手、空闲期的创业者……其中又以经常接触网络的人为主。其实熬夜并不是一种正常的 习惯&#xff0c;它和社交网络依赖症&#xff08;一直刷手机、刷微博、只要手机不在身边…

最有效率地戒掉晚睡强迫症(熬夜强迫症、假象失眠症等等)

熬夜的习惯最常出现在时间分配比较自由的年轻人中&#xff1a;大学生、待业者、自由撰稿人、网络作者、画手、空闲期的创业者……其中又以经常接触网络的人为主。其实熬夜并不是一种正常的 习惯&#xff0c;它和社交网络依赖症&#xff08;一直刷手机、刷微博、只要手机不在身边…

Python恢复初始的pip list(清空所有包)

遇到的问题和解决方案 在Python安装包的时候&#xff0c;不小心装到外面的干净环境而不是虚拟环境中了&#xff0c;对于我这个强迫症患者来说肯定是心里很不舒服&#xff0c;于是恢复开始&#xff1a;在Python安装包的时候&#xff0c;不小心装到外面的干净环境而不是虚拟环境…

【PTA】强迫症

个人名片&#xff1a; 博主&#xff1a;酒徒ᝰ. 个人简介&#xff1a;沉醉在酒中&#xff0c;借着一股酒劲&#xff0c;去拼搏一个未来。 专栏&#xff1a;PTA习题及解析 介绍&#xff1a;记录了博主在pta学习练题 目录 前言1.简介2.优点 一、题目二、代码三、鼓励 前言 1.简介…