独立 ⇒ \Rightarrow ⇒不相关
文章目录
- 独立 ⇒ \Rightarrow ⇒不相关
- 判定定理
- 独立性 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y)
- 证明不独立只需要用P(AB)≠P(A)P(B)举反例
- 离散型
- 连续型
- 不相关 ρ x y = 0 \rho_{xy}=0 ρxy=0(协方差为0)
- 性质定理
- 独立
- 当Y关于X的条件概率密度函数中没有出现x时,随机变量X和Y相互独立
- 不相关
- ==独立和不相关的关系==
感觉这两个概念类似于平行四边形和菱形的关系,在初中学这两个几何概念时只要牢记判定定理和性质定理就可以解题
结论:
1.不相关一定独立,但是独立不一定不相关,即不相关条件更严格
2.目前课本上提到的均值,方差的性质都和不相关有关,当然从独立推到这些性质也是成立的
判定定理
独立性 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VulG7VUa-1646729696517)(https://gitee.com/deutschball/imperial-march/raw/master/X[G@0YEW2GO%U]QRO852GC8.jpg)]
A一定是错误的
B一定是正确的,任何随机变量都有分布律,也就都有分布函数
C只有对连续型随机变量成立,离散型随机变量没有概率密度这种东西
D不一定所有随机变量都有数学期望,比如柯西分布
设 X , Y X,Y X,Y是两个随机变量,二者的联合分布函数 F ( x , y ) F(x,y) F(x,y),边缘分布函数分别为 F X ( x ) , F Y ( y ) F_X(x),F_Y(y) FX(x),FY(y),如果有
F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y)
则称随机变量 X , Y X,Y X,Y相互独立
证明不独立只需要用P(AB)≠P(A)P(B)举反例
离散型
对于离散型随机变量X,Y,设其联合分布律为 P ( X = x i , Y = y j ) = p i j P(X=x_i,Y=y_j)=p_{ij} P(X=xi,Y=yj)=pij,边缘分布律为 P ( X = x i ) = p i ⋅ , P ( Y = y j ) = p ⋅ j P(X=x_i)=p_{i·},P(Y=y_j)=p_{·j} P(X=xi)=pi⋅,P(Y=yj)=p⋅j
则X,Y相互独立的充要条件为
p i j = p i ⋅ p ⋅ j p_{ij}=p_{i·}p_{·j} pij=pi⋅p⋅j
证明:
必要性证明
即证 F ( x , y ) = F X ( x ) F Y ( y ) ⇒ P ( X = x , Y = y ) = P ( X = x ) P ( Y = y ) F(x,y)=F_X(x)F_Y(y)\Rightarrow P(X=x,Y=y)=P(X=x)P(Y=y) F(x,y)=FX(x)FY(y)⇒P(X=x,Y=y)=P(X=x)P(Y=y)
这个证明是相对困难的,因为分布函数实际上是 P ( X ≤ x , Y ≤ y ) = P ( X ≤ x ) P ( Y ≤ y ) P(X\leq x,Y\leq y)=P(X\leq x)P(Y\leq y) P(X≤x,Y≤y)=P(X≤x)P(Y≤y)的区间形式,而要证明的是点的形式
P ( X = x , Y = y ) = P ( X = x ) P ( Y = y ) P(X=x,Y=y)=P(X=x)P(Y=y) P(X=x,Y=y)=P(X=x)P(Y=y)
关键是如何从一个小于等于x小于等于y的区间降维到一个点(x,y)上.能够想到的是二维差分,
对联合分布律作二维差分得到
P ( x − a ≤ X ≤ x , y − a ≤ Y ≤ y ) = P ( X ≤ x , Y ≤ y ) + P ( X ≤ x − a , Y ≤ y − b ) − P ( X ≤ x , Y ≤ y − b ) − P ( X ≤ x − a , Y ≤ y ) P(x-a\leq X\leq x,y-a\leq Y\leq y)=P(X\leq x,Y\leq y)+P(X\leq x-a,Y\leq y-b)-P(X\leq x,Y\leq y-b)-P(X\leq x-a,Y\leq y) P(x−a≤X≤x,y−a≤Y≤y)=P(X≤x,Y≤y)+P(X≤x−a,Y≤y−b)−P(X≤x,Y≤y−b)−P(X≤x−a,Y≤y)由已知条件 F ( x , y ) = F X ( x ) F Y ( y ) F(x,y)=F_X(x)F_Y(y) F(x,y)=FX(x)FY(y)得到:
P ( X ≤ x , Y ≤ y ) = P ( X ≤ x ) P ( Y ≤ y ) P(X\leq x,Y\leq y)=P(X\leq x)P(Y\leq y) P(X≤x,Y≤y)=P(X≤x)P(Y≤y)
那么有
P ( x − a ≤ X ≤ x , y − a ≤ Y ≤ y ) = P ( X ≤ x ) P ( Y ≤ y ) + P ( X ≤ x − a ) P ( Y ≤ y − b ) − P ( X ≤ x ) P ( Y ≤ y − b ) − P ( X ≤ x − a ) P ( Y ≤ y ) = P ( X ≤ x ) [ P ( Y ≤ y ) − P ( Y ≤ y − b ) ] + P ( X ≤ x − a ) [ P ( Y ≤ y ) − P ( Y ≤ y − b ) ] = [ P ( X ≤ x ) − P ( X ≤ x − a ) ] [ P ( Y ≤ y ) − P ( Y ≤ y − b ) ] = P ( x − a < X ≤ x ) P ( y − b < Y ≤ y ) \begin{aligned} &P(x-a\leq X\leq x,y-a\leq Y\leq y)\\ &=P(X\leq x)P(Y\leq y)+P(X\leq x-a)P(Y\leq y-b)-P(X\leq x)P(Y\leq y-b)-P(X\leq x-a)P(Y\leq y)\\ &=P(X\leq x)[P(Y\leq y)-P(Y\leq y-b)]+P(X\leq x-a)[P(Y\leq y)-P(Y\leq y-b)]\\ &=[P(X\leq x)-P(X\leq x-a)][P(Y\leq y)-P(Y\leq y-b)]\\ &=P(x-a< X\leq x)P(y-b< Y\leq y) \end{aligned} P(x−a≤X≤x,y−a≤Y≤y)=P(X≤x)P(Y≤y)+P(X≤x−a)P(Y≤y−b)−P(X≤x)P(Y≤y−b)−P(X≤x−a)P(Y≤y)=P(X≤x)[P(Y≤y)−P(Y≤y−b)]+P(X≤x−a)[P(Y≤y)−P(Y≤y−b)]=[P(X≤x)−P(X≤x−a)][P(Y≤y)−P(Y≤y−b)]=P(x−a<X≤x)P(y−b<Y≤y)
对于给定的x,y有
$$
\lim_{a\rightarrow x,b\rightarrow y}P(x-a\leq X\leq x,y-a\leq Y\leq y)=P(X=x,Y=y)\\lim_{a\rightarrow x,b\rightarrow y}=P(x-a< X\leq x)P(y-b< Y\leq y)=P(X=x)P(Y=y)\
P(X=x,Y=y)=P(X=x)P(Y=y)
$$
证毕充分性证明
P ( X = x , Y = y ) = P ( X = x ) P ( Y = y ) ⇒ F ( x , y ) = F X ( x ) F Y ( y ) P(X=x,Y=y)=P(X=x)P(Y=y)\Rightarrow F(x,y)=F_X(x)F_Y(y) P(X=x,Y=y)=P(X=x)P(Y=y)⇒F(x,y)=FX(x)FY(y)
P ( X ≤ x i , Y ≤ y i ) = ∑ k = 1 i ∑ l = 1 j P ( X = x k , Y = y l ) = ∑ k = 1 i ∑ l = 1 j P ( X = x k ) P ( Y = y l ) = [ ∑ k = 1 i P ( X = x k ) ] [ ∑ l = 1 j P ( Y = y l ) ] = P ( X ≤ x i ) P ( Y ≤ y j ) \begin{aligned} &P(X\leq x_i,Y\leq y_i)\\ &=\sum_{k=1}^i\sum_{l=1}^jP(X=x_k,Y=y_l)\\ &=\sum_{k=1}^i\sum_{l=1}^jP(X=x_k)P(Y=y_l)\\ &=[\sum_{k=1}^iP(X=x_k)][\sum_{l=1}^jP(Y=y_l)]\\ &=P(X\leq x_i)P(Y\leq y_j) \end{aligned} P(X≤xi,Y≤yi)=k=1∑il=1∑jP(X=xk,Y=yl)=k=1∑il=1∑jP(X=xk)P(Y=yl)=[k=1∑iP(X=xk)][l=1∑jP(Y=yl)]=P(X≤xi)P(Y≤yj)
证毕
连续型
对于连续型随机变量X,Y,设其联合概率密度为 f ( x , y ) f(x,y) f(x,y),边缘概率密度分别为 f X ( x ) , f Y ( y ) f_X(x),f_Y(y) fX(x),fY(y),则 X , Y X,Y X,Y相互独立的充要条件为:
f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)
证明:
必要性证明
即证 F ( x , y ) = F X ( x ) F Y ( y ) ⇒ f ( x , y ) = f X ( x ) f Y ( y ) F(x,y)=F_X(x)F_Y(y)\Rightarrow f(x,y)=f_X(x)f_Y(y) F(x,y)=FX(x)FY(y)⇒f(x,y)=fX(x)fY(y)
f ( x , y ) = ∂ 2 F ( x , y ) ∂ x ∂ y = ∂ F X ( x ) ∂ x ∂ F Y ( y ) ∂ y = f X ( x ) f Y ( y ) f(x,y)=\frac{\partial^2{F(x,y)}}{\partial x\partial y}=\frac{\partial F_X(x)}{\partial x}\frac{\partial F_Y(y)}{\partial y}=f_X(x)f_Y(y) f(x,y)=∂x∂y∂2F(x,y)=∂x∂FX(x)∂y∂FY(y)=fX(x)fY(y)
充分性证明即证 f ( x , y ) = f X ( x ) f Y ( y ) ⇒ F ( x , y ) = F X ( x ) F Y ( y ) f(x,y)=f_X(x)f_Y(y)\Rightarrow F(x,y)=F_X(x)F_Y(y) f(x,y)=fX(x)fY(y)⇒F(x,y)=FX(x)FY(y)
F ( x , y ) = ∫ − ∞ x ∫ − ∞ y f ( x , y ) d x d y = ∫ − ∞ x ∫ − ∞ y f X ( x ) f Y ( y ) d x d y = ∫ − ∞ x f X ( x ) d x ∫ − ∞ y f Y ( y ) d y = F X ( x ) F Y ( y ) F(x,y)=\int_{-\infin}^x\int_{-\infin}^y f(x,y)dxdy\\ =\int_{-\infin}^x\int_{-\infin}^yf_X(x)f_Y(y)dxdy\\ =\int_{-\infin}^x f_X(x)dx\int_{-\infin}^y f_Y(y)dy\\ =F_X(x)F_Y(y) F(x,y)=∫−∞x∫−∞yf(x,y)dxdy=∫−∞x∫−∞yfX(x)fY(y)dxdy=∫−∞xfX(x)dx∫−∞yfY(y)dy=FX(x)FY(y)
证毕
不相关 ρ x y = 0 \rho_{xy}=0 ρxy=0(协方差为0)
设随机变量X,Y的相关系数为 ρ x y \rho_{xy} ρxy,如果 ρ x y = 0 \rho_{xy}=0 ρxy=0则称随机变量X,Y线性无关,即不相关
相关系数其计算公式为
ρ x y = c o v ( X , Y ) D ( X ) D ( Y ) \rho_{xy}=\frac{cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}} ρxy=D(X)D(Y)cov(X,Y)
其中 c o v ( X , Y ) cov(X,Y) cov(X,Y)为随机变量X,Y的相关系数,其计算公式为
c o v ( X , Y ) = E [ ( X − E X ) ( Y − E Y ) ] = E ( X Y ) − E ( X ) E ( Y ) cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-E(X)E(Y) cov(X,Y)=E[(X−EX)(Y−EY)]=E(XY)−E(X)E(Y)
在证明随机变量不相关时一定用协方差等于0判断
性质定理
独立
当Y关于X的条件概率密度函数中没有出现x时,随机变量X和Y相互独立
出乎意料的一个结论,在做2019-2020概率论期末卷子时答案是这么写的
已知 X ∼ U ( 2 , 3 ) X\sim U(2,3) X∼U(2,3)当 X = x X=x X=x时 f Y ∣ X ( y ∣ x ) = { 1 , 1 ≤ y ≤ 2 0 , 其 他 f_{Y|X}(y|x)=\begin{cases}1,1\leq y\leq 2\\0,其他\end{cases} fY∣X(y∣x)={1,1≤y≤20,其他
答案直接说"条件概率和x无关,因此X,Y相互独立",
???
不相关
充要条件 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
由X,Y不相关得到 ρ x y = 0 \rho_{xy}=0 ρxy=0那么 c o v ( X , Y ) = 0 cov(X,Y)=0 cov(X,Y)=0那么 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y),显然不相关和 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)互为充要条件
充要条件 a , b ≠ 0 , D ( a X + b Y ) = 0 a,b≠0,D(aX+bY)=0 a,b=0,D(aX+bY)=0
D ( a X + b Y ) = E ( a X + b Y ) 2 − E 2 ( a X + b Y ) = E ( a 2 X 2 + 2 a b X Y + b 2 Y 2 ) − ( a E ( X ) + b E ( Y ) ) 2 = 2 a b E ( X Y ) − 2 a b E ( X ) E ( Y ) = 2 a b ( E ( X Y ) − E ( X ) E ( Y ) ) = 0 \begin{aligned} D(aX+bY)&=E(aX+bY)^2-E^2(aX+bY)\\ &=E(a^2X^2+2abXY+b^2Y^2)-(aE(X)+bE(Y))^2\\ &=2abE(XY)-2abE(X)E(Y)\\ &=2ab(E(XY)-E(X)E(Y))\\ &=0 \end{aligned} D(aX+bY)=E(aX+bY)2−E2(aX+bY)=E(a2X2+2abXY+b2Y2)−(aE(X)+bE(Y))2=2abE(XY)−2abE(X)E(Y)=2ab(E(XY)−E(X)E(Y))=0
因而 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
独立和不相关的关系
任何情况下独立 ⇒ \Rightarrow ⇒不相关
X,Y独立证明 E ( X Y ) = E ( X ) E ( Y ) E(XY)=E(X)E(Y) E(XY)=E(X)E(Y)
E ( X Y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ x y f ( x , y ) d x d y E(XY)=\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xyf(x,y)dxdy E(XY)=∫−∞+∞∫−∞+∞xyf(x,y)dxdy
又X,Y相互独立,由连续性随机变量的判定定理有 f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)带入上式得到
E ( X Y ) = ∫ − ∞ + ∞ x f X ( x ) d x ∫ − ∞ + ∞ y f Y ( y ) d y = E ( X ) E ( Y ) E(XY)=\int_{-\infin}^{+\infin}xf_X(x)dx\int_{-\infin}^{+\infin}yf_Y(y)dy\\ =E(X)E(Y) E(XY)=∫−∞+∞xfX(x)dx∫−∞+∞yfY(y)dy=E(X)E(Y)
不相关无法证明独立的例子
由X,Y不相关得到:
∫ − ∞ + ∞ ∫ − ∞ + ∞ x y [ f ( x , y ) − f X ( x ) f Y ( y ) ] d x d y \int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xy[f(x,y)-f_X(x)f_Y(y)]dxdy ∫−∞+∞∫−∞+∞xy[f(x,y)−fX(x)fY(y)]dxdy
下面举例 f ( x , y ) − f X ( x ) f Y ( y ) ≠ 0 f(x,y)-f_X(x)f_Y(y)≠0 f(x,y)−fX(x)fY(y)=0但是上式仍然成立的例子
令 f ( x , y ) − f X ( x ) f Y ( y ) = 1 x + 1 y f(x,y)-f_X(x)f_Y(y)=\frac{1}{x}+\frac{1}{y} f(x,y)−fX(x)fY(y)=x1+y1,带入上式得到:
∫ − ∞ + ∞ ∫ − ∞ + ∞ x y [ f ( x , y ) − f X ( x ) f Y ( y ) ] d x d y = ∫ − ∞ + ∞ ∫ − ∞ + ∞ ( y + x ) d x d y \int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}xy[f(x,y)-f_X(x)f_Y(y)]dxdy\\ =\int_{-\infin}^{+\infin}\int_{-\infin}^{+\infin}(y+x)dxdy\\ ∫−∞+∞∫−∞+∞xy[f(x,y)−fX(x)fY(y)]dxdy=∫−∞+∞∫−∞+∞(y+x)dxdy
取一个对称的上下界a,
∫ − a + a ∫ − a + a ( x + y ) d x d y = ∫ − a + a d y [ 1 2 x 2 + y x ] − a + a = a ∫ − a + a d y 2 = 0 \begin{aligned} &\int_{-a}^{+a}\int_{-a}^{+a}(x+y)dxdy\\ &=\int_{-a}^{+a}dy [\frac{1}{2}x^2+yx]^{+a}_{-a}\\ &=a\int_{-a}^{+a}dy^2\\ &=0 \end{aligned} ∫−a+a∫−a+a(x+y)dxdy=∫−a+ady[21x2+yx]−a+a=a∫−a+ady2=0
那么
lim a → + ∞ ∫ − a + a ∫ − a + a ( x + y ) d x d y = 0 \lim_{a\rightarrow +\infin}\int_{-a}^{+a}\int_{-a}^{+a}(x+y)dxdy=0 a→+∞lim∫−a+a∫−a+a(x+y)dxdy=0
即此时X,Y不相关,但是不能得到X,Y相互独立
只有正态随机变量X,Y相互独立 ⇔ \Leftrightarrow ⇔X,Y不相关
证明:
即证当正太随机变量X,Y不相关时,必有 f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)
二维正正态分布联合概率密度为
f ( x , y ) = 1 2 π σ 1 σ 2 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) [ ( x − μ 1 ) 2 σ 1 2 − 2 ρ ( x − μ 1 ) ( x − μ 2 ) σ 1 σ 2 + ( x − μ 2 ) 2 σ 2 2 ] f(x,y)=\frac{1}{2\pi \sigma _1\sigma_2 \sqrt{1-\rho^2}} e^{-\frac{1}{2(1-\rho^2)} [\frac{(x-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(x-\mu_2)}{\sigma_1\sigma_2}+\frac{(x-\mu_2)^2}{\sigma_2^2}]} f(x,y)=2πσ1σ21−ρ21e−2(1−ρ2)1[σ12(x−μ1)2−2ρσ1σ2(x−μ1)(x−μ2)+σ22(x−μ2)2]
至于这个式子怎么来的,我不知道
f X ( x ) = 1 2 π σ 1 e − ( x − μ 1 ) 2 2 σ 1 2 f Y ( y ) = 1 2 π σ 2 e − ( x − μ 2 ) 2 2 σ 2 2 f_X(x)=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}\\ f_Y(y)=\frac{1}{\sqrt{2\pi}\sigma_2}e^{-\frac{(x-\mu_2)^2}{2\sigma_2^2}} fX(x)=2πσ11e−2σ12(x−μ1)2fY(y)=2πσ21e−2σ22(x−μ2)2
如果有 f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX(x)fY(y)则必有 ρ = 0 \rho=0 ρ=0
而 ρ = ρ x y \rho=\rho_{xy} ρ=ρxy为X,Y的相关系数,当X,Y不相关时显然相关系数为0
设(X,Y)服从二维正态分布,且有 D ( X ) = σ X 2 , D ( Y ) = σ Y 2 D(X)=\sigma_X^2,D(Y)=\sigma_Y^2 D(X)=σX2,D(Y)=σY2,
证明:当 a = σ x 2 σ Y 2 a=\frac{\sigma_x^2}{\sigma_Y^2} a=σY2σx2,随机变量 W = X − a Y W=X-aY W=X−aY与随机变量 V = X + a Y V=X+aY V=X+aY相互独立
显然W,V是X,Y的线性组合,也服从于二维正态分布
由正态随机变量X,Y相互独立 ⇔ \Leftrightarrow ⇔X,Y不相关,我们只需要证明一个相对比较弱的命题:W,V不相关
即证 c o v ( W , V ) = 0 cov(W,V)=0 cov(W,V)=0
c o v ( W , V ) = E ( W V ) − E ( W ) E ( V ) = E ( X 2 − a 2 Y 2 ) − 0 = E ( X 2 ) − a 2 E ( Y 2 ) cov(W,V)=E(WV)-E(W)E(V)=E(X^2-a^2Y^2)-0=E(X^2)-a^2E(Y^2) cov(W,V)=E(WV)−E(W)E(V)=E(X2−a2Y2)−0=E(X2)−a2E(Y2)
而
E ( X 2 ) = D ( X ) + E 2 ( X ) = D ( X ) = σ X 2 E(X^2)=D(X)+E^2(X)=D(X)=\sigma_X^2 E(X2)=D(X)+E2(X)=D(X)=σX2
E ( Y 2 ) = D ( Y ) + E 2 ( Y ) = D ( Y ) = σ Y 2 E(Y^2)=D(Y)+E^2(Y)=D(Y)=\sigma_Y^2 E(Y2)=D(Y)+E2(Y)=D(Y)=σY2
故 c o v ( W , V ) = 0 cov(W,V)=0 cov(W,V)=0即W,V不相关
因而正态随机变量W,V独立
证明独立因此可以对于正态随机变量证明不相关