联合概率分布

article/2025/10/2 2:14:41

离散随机变量的联合分布

我们先从离散的情况出发,了解多个随机变量并存的含义。

之前说,一个随机变量是从样本空间到实数的映射。然而,所谓的映射是人为创造的。从一个样本空间,可以同时产生多个映射。比如,我们的实验是连续三次投硬币,样本空间为

Ω={hhh,hht,hth,thh,htt,tht,tth,ttt} Ω={hhh,hht,hth,thh,htt,tht,tth,ttt}

h为正面,t为反面。在同一样本空间上,我们可以定义多个随机变量,比如:

  • X X: 投掷为正面的总数,可以取值0,1,2,3
  • Y Y: 最后一次出现负面的总数,可以取值0,1
  • Z Z: 将正面记为10,负面记为5,第一次与第三次取值的差,可以有5, -5, 0

这三个随机变量可以看作一个有三个分量的矢量。所以定义在同一样本空间的多随机变量,是一个从样本空间到矢量的映射。 

(从这个角度上说,单一随机变量是一个从样本空间到一个有一个分量的矢量的映射)

 

如果样本空间 Ω Ω中每个结果出现的概率相等。而样本空间中共有8个结果,那么个每个结果的出现的概率都是1/8。据此,我们可以计算联合概率,比如

P(X=0,Y=1)=P({ttt})=1/8 P(X=0,Y=1)=P({ttt})=1/8

P(X=1,Y=1)=P({htt,tht})=2/8 P(X=1,Y=1)=P({htt,tht})=2/8

对于 X=x,Y=y X=x,Y=y,我们寻找样本空间中满足这两个取值的所有元素。这些元素构成一个样本空间的子集,该子集的概率就是 P(X=x,Y=y) P(X=x,Y=y)的联合概率。 p(x,y)=P(X=x,Y=y) p(x,y)=P(X=x,Y=y)称为联合概率质量函数(joint PMF, joint probability mass function)。联合概率可以看做两个事件同时发生时的概率,事件A为 X=x X=x,事件B为 Y=y Y=y,即 P(AB) P(A∩B)

找到所有可能取值组合的概率,就找到了这两个随机变量的联合分布:

X X Y Y P(X,Y) P(X,Y) 对应子集
0 0 0 Φ Φ
1 0 1/8 tth
2 0 2/8 thh, hth
3 0 1/8 hhh
0 1 1/8 ttt
1 1 2/8 htt, tht
2 1 1/8 hht
3 1  0 Φ Φ

 联合分布

联合分布描述了所有可能的取值情况。因此,联合概率密度函数的累积和为1。

 

连续随机变量的联合分布

我们知道,单个连续随机变量的概率是变量在某个区间(某段线的“长度”)取值的概率。做类似的推广,多个连续随机变量的概率,是这多个随机变量在多维区间的概率。比如两个随机变量,我们需要表达一个二维区间的概率,比如 P(aXb,cYd) P(a≤X≤b,c≤Y≤d)。这个二维区间可以有一个类似于一个小补丁的“面积”。二维区间对应的概率是一个体积。

 

面积对应的体积

 

在单变量情况下,概率是一个“面积”,是由区间的“长度”和密度函数(一条曲线)围成的。这里的“体积”是二维区间的“面积”和密度函数(一个曲面)围成的。我们可以使用联合概率密度函数(joint PDF, joint probability density function)来表达多随机变量的分布。对于双变量的联合分布来说,它等于无穷小块的概率,除以无穷小块的面积。

用微积分的语言来说,就是

P(aXb,cYd)=badcf(x,y)dxdy P(a≤X≤b,c≤Y≤d)=∫ab∫cdf(x,y)dxdy

f(x,y) f(x,y)就是描述X和Y的联合分布的联合概率密度函数。

 

联合概率密度函数描述了所有可能取值的情况,因此有

+f(x,y)dxdy=1 ∫−∞+∞∫−∞∞f(x,y)dxdy=1

 

实例

下面是两个连续随机变量的联合PDF:

f(x,y)={2x0forfor0x,y1else f(x,y)={2xfor0≤x,y≤10forelse

通过积分,计算X在0到0.5,而Y在0到1的概率:

P(0X0.5,0Y1)=0.50102xdxdy=0.25 P(0≤X≤0.5,0≤Y≤1)=∫00.5∫012xdxdy=0.25

 

我们之间也说到,单个随机变量的概率对应线段到概率密度曲线之间的面积。而两个随机变量的概率对应小块到概率密度面之间的体积。

我们可以绘制 f(x,y) f(x,y)的分布图形,即一个二维的平面。图中的颜色标记了f(x, y)值的大小。如下: 

可以看到,f(x, y)随X增大而增大,在X值确定时,f(x, y)不随Y变化。

边缘概率

联合分布包含了多个随机变量的分布信息。我们当然可以从联合分布中,提取出任意一个单一随机变量的分布,也就是所谓的边缘分布(marginal distribution)。

对于离散随机变量,可以获得边缘概率质量函数(marginal pmf):

pX(x)=allyp(x,y) pX(x)=∑allyp(x,y)

pY(y)=allxp(x,y) pY(y)=∑allxp(x,y)

在求X的单一边缘分布时, 我们累加了相同x值、不同y值时的多个联合概率,从而获得该x值的的总体概率,即边缘概率。

 

连续随机变量X的边缘密度函数(marginal pdf, marginal probability density function)可以定义为

fX(x)=+f(x,y)dy fX(x)=∫−∞+∞f(x,y)dy

fX(x) fX(x)是联合密度函数对Y的积分。通过积分,我们将不同Y取值时的联合概率加在一起,就获得纯粹的单一X的分布状况。

类似的,Y的边缘密度函数为

fY(y)=+f(x,y)dx fY(y)=∫−∞+∞f(x,y)dx

 

取离散随机分布的例子,即掷三次硬币

  0 1 2 3 p(y)
0 0 1/8 2/8 1/8 1/2
1 1/8 2/8 1/8 0 1/2
p(x) 1/8 3/8 3/8 1/8  

边缘概率是对各行和列的累加。最后一列p(y)是Y的分布,Y有1/2的概率取0,1/2的概率取1。最后一行p(x)是X的分布。

 

取连续随机分布的例子,即下面的连续分布:

f(x,y)={2x0forfor0x,y1else f(x,y)={2xfor0≤x,y≤10forelse

可以得到:

fX(x)=2x,0x1 fX(x)=2x,0≤x≤1

fY(y)=1,0y1 fY(y)=1,0≤y≤1

 

条件分布

我们之前基于事件介绍了条件概率,即如果事件B发生,那么事件A发生的概率。相同的概念可以引申到随机变量。随机变量取某个值,这可以看做一个事件。我们想知道,随机变量Y取值y,另一个随机变量X为x的概率。

 

与事件的条件概率类似,假设 pY(y)0 pY(y)≠0,在 Y=y Y=y的条件下,随机变量X取值为x的概率定义为: 

p(x|y)=p(x,y)pY(y) p(x|y)=p(x,y)pY(y)

X=x,Y=y X=x,Y=y同时发生的概率,除以Y取值为y的的概率。

 

以掷三次硬币为例。条件为Y值取值0,即最后一次投掷为正面时。此时,X取值为2有两种可能,即前两次为ht和th。由于前两次投掷有四种组合,所以概率为0.5。

我们可以通过条件概率的公式计算并验证:

p(2|0)=p(2,0)pY(0)=2/81/2=0.5 p(2|0)=p(2,0)pY(0)=2/81/2=0.5

 

如果说概率是分一个总和为1的大饼,如果大饼分八块,每块就是1/8。假设半个饼上撒胡椒,另半个饼上撒辣椒。那么在胡椒饼(相当于我们的条件)上选取一块的概率,就是1/4。此时,也就是用原来的概率除以胡椒饼所占的比重。

 

对于连续随机变量,假设 fY(y)0 fY(y)≠0,给定Y=y,随机变量X的条件分布为:

f(x|y)=f(x|Y=y)=f(x,y)fY(y) f(x|y)=f(x|Y=y)=f(x,y)fY(y)

 

独立随机变量

正如事件之间可以相互独立一样,随机变量之间也可以相互独立。当X独立于Y时,我们可以相像,Y的取值,将不影响X的概率。也就是说

p(x|y)=pX(x) p(x|y)=pX(x)

这意味着,当且仅当

p(x,y)=pX(x)pY(y) p(x,y)=pX(x)pY(y)

时,X和Y相互独立。

可以验证,连续投掷三次硬币的例子中,X和Y并不独立,比如

p(1,1)=2/8 p(1,1)=2/8

pX(1)=3/8 pX(1)=3/8

pY(1)=1/2 pY(1)=1/2

因此,

p(1,1)pX(1)pY(1) p(1,1)≠pX(1)pY(1)

X和Y并不独立。

对于连续随机变量来说,当且仅当

f(x,y)=fX(x)fY(y) f(x,y)=fX(x)fY(y)

时,X和Y相互独立。

对于分布

f(x,y)={2x0forfor0x,y1else f(x,y)={2xfor0≤x,y≤10forelse

使用之前获得的边际分布,可以验证

f(x,y)=fX(x)fY(y) f(x,y)=fX(x)fY(y)

因此,对于该分布来说,X和Y相互独立。



http://chatgpt.dhexx.cn/article/UsNprWZY.shtml

相关文章

高斯推断(联合高斯概率密度函数,分解与推断)

对于⼀对服从多元正态分布的变量 ( x , y ) ,可以写出它们的联合概率密度函数: 根据Bays rule, ,能不能得到条件概率 和边缘概率 的高斯分布? 高斯推断告诉我们是可以的! 是左边被拆分成两个部分的形式&a…

联合密度函数求期望_已知概率密度函数怎么求它的数学期望和方差

展开全部 代入公式。在[a,b]上的均匀分32313133353236313431303231363533e58685e5aeb931333431353939布,期望(ab)/2,方差[(b-a)^2]/2。代入直接得到结论。如果不知道均匀分布的期望和方差公式,只能按步就班的做: 期望:…

核密度函数构建联合概率密度函数

核密度估计其实就是通过核函数(如高斯)将每个数据点的数据带宽当作核函数的参数,得到N个核函数,再线性叠加就形成了核密度的估计函数,归一化后就是核密度概率密度函数了。 将设有N个样本点,对这N个点进行上…

高斯概率密度函数

高斯概率密度函数 1. 单变量正态分布 单变量正态分布概率密度函数定义为: ρ ( x ) 1 2 π σ e − 1 2 ( x − μ σ ) 2 (1) \rho(x)\frac{1}{\sqrt{2\pi \sigma}} e^{-\frac{1}{2} (\frac{x- \mu}{\sigma})^2} \tag 1 ρ(x)2πσ ​1​e−21​(σx−μ​)2(1…

为什么边缘概率密度是联合概率密度的积分_我为什么弃用GAN?

贾浩楠 发自 凹非寺量子位 报道 | 公众号 QbitAI 输出单一、调参麻烦、损失函数不能收敛、稳定性差。 苏黎世理工大学的博士Andreas Lugmayr历数了各种GAN的“罪状”,说出了今后弃用GAN的话。 说出“弃用”,当然是已经有了B计划。 Andreas Lugmayr博士和…

联合概率密度,条件概率,乘法公式,求和公式,边缘分布,链式法则,贝叶斯公式...

联合概率密度 P(A^B) 条件概率 从面积比例看出,P(A|B)等于B中A的面积(P(A^B))除以B的面积(P(B))。 乘法公式(乘积法则) 假如事件A与B相互独立,那么: 相互独立:表示两个事件互不影响。 互斥:表示两个事件不能同时发生。互斥事件一定不独立(因为一件事的发生导致了另…

概率论——随机变量、概率分布函数、概率密度函数、联合概率密度

(博客上编辑公式很麻烦,大多上自己文档的截图了) (随机试验,样本空间等可参考https://blog.csdn.net/qq_37601846/article/details/103507576) 1. 随机变量(random variable) &…

概率统计笔记:高斯分布的联合概率密度

1 符号说明 我们的目的是求的概率 2 求p(y) 不难发现,y与x的关系为线性高斯模型,则yy与x符合下述关系 于是可以得到y的分布 3 求p(z) 我们现在的目标就是求这个▲是什么 参考资料:机器学习-白板推导系列笔记(二)-数…

利用MATLAB来绘制二维随机变量的联合概率密度图像

本文档通过MATLAB来绘制二维随机变量(X,Y)的联合概率密度函数。 第一种类型,X服从标准正态分布,Y服从均匀分布。 【例题】已知随机变量X与Y相互独立,X~N(0,1);Y在区间[0,2]上服从均匀分布。求: (1)二维随机…

联合概率密度函数的基本结论

若已知连联合概率密度函数: 则: X边缘密度函数: Y边缘密度函数: x,y从负无穷到正无穷的积分为: X与Y的边缘分布函数:可分别通过X与Y 的边缘密度函数求得。(分布函数由密度函数求积分得到&#x…

图解联合概率密度、边缘概率密度、条件概率密度之间的关系

图解联合概率密度、边缘概率密度、条件概率密度之间的关系 笔记来源:L10.3 Comments on Conditional PDFs 联合概率密度、条件概率密度的关系 个人理解:某个条件概率密度函数图像是联合概率密度函数图像的某个经过放缩后的“切片”(y取某个…

Python出现ValueError: check_hostname requires server_hostname如何解决

Python出现ValueError: check_hostname requires server_hostname如何解决 Python出现ValueError: check_hostname requires server_hostname如何解决 Python出现ValueError: check_hostname requires server_hostname如何解决 在安装myqr库的时候,出现了ValueErro…

python3.8 check_hostname requires server_hostname

这个error我查了下,在多个方面运行程序时都会报错,本人是在安装下面的轮子时报的错,查了好多,大部分是修改某一包的版本 但,有一个方法贼简单,分享下: 将 使用代理服务器 设置为 关 &#xff…

ValueError: check_hostname requires server_hostname解决方法

使用python的pip安装第三方包的时候会出现这个问题 查看了一些解决方法 关掉一些代理VPN然后重试,再不行就关闭计算机代理: PS H:\python_project\Python-Multiple-Image-Stitching-master\Python-Multiple-Image-Stitching-master> pip install ope…

彻底理解hostname---四种方法修改hostname值

当我觉得对Linux系统下修改hostname已经非常熟悉的时候,今天碰到了几个个问题,这几个问题给我好好上了一课,很多知识点,当你觉得你已经掌握的时候,其实你了解的还只是皮毛。技术活,切勿浅尝则止&#xff01…

Linux命令之获取和修改主机名hostname

概述 hostname 命令可以获取当前主机名和临时修改主机名。 语法 该命令的语法如下: hostname [选项] [参数]该命令支持的选项有: 选项说明-a显示主机别名-d显示DNS域名-f显示FQDN名称-i显示主机的ip地址-s显示短主机名称,在第一个点处截断…

【安全测试学习】数据库基础

以上来自学习极客时间《Web 安全攻防实战》课程内容,汇总整理思维导图。

安全测试-数据安全测试(2)

目录 前言 一、环境准备 1.1 模拟器软件下载 1.2 账号登录注册 1.3 版本选择 二、获取 SQLite 文件 Android 三、查看 SQLite 文件 四、SQLite 数据安全 4.1SQL 注入 4.2预防 SQL 注入 前言 捣鼓了那么久,终于整理出来了,可能中间会出现一些波…

Web安全攻防渗透测试

1. Nmap的基本 Nmap ip 6 ip Nmap -A 开启操作系统识别和版本识别功能 – T(0-6档) 设置扫描的速度 一般设置T4 过快容易被发现 -v 显示信息的级别,-vv显示更详细的信息 192.168.1.1/24 扫描C段 192.168.11 -254 上 nmap -A -T…

安全测试-- WEB 实战

增:XSS、文件上传get shell 删:越权 查:sql注入、越权 改:XSS、越权 好 也可以用wvs先扫 根据报告找漏洞的点 一 端口信息收集 kali : nmap -A -T4 192.168.1.35 端口信息收集 端口信息收集资料 问题:端口扫描是…