高斯分布和卡方分布

article/2025/9/29 19:55:59

高斯分布和卡方分布

  • 高斯分布和卡方分布
    • 高斯分布
      • 1 单元高斯分布
        • 1.1 一维随机变量
        • 1.2 标准正太分布
        • 1.3 numpy中使用正太分布
      • 2 多元高斯分布
        • 2.1 独立多元/维高斯分布
        • 2.2 举例-画2维独立不相关高斯图
        • 2.3 相关系数
        • 2.3 举例-画2维不独立相关高斯图

高斯分布和卡方分布

高斯分布

1 单元高斯分布

1.1 一维随机变量

定义:若连续型随机变量 X X X的概率密度为
(1.1) f ( x ) = 1 2 π σ e − ( x − μ ) 2 2 σ 2 , − ∞ &lt; x &lt; ∞ , f(x)=\frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}, -\infty&lt;x&lt;\infty,\tag{1.1} f(x)=2π σ1e2σ2(xμ)2,<x<,(1.1)
其中 μ , σ ( σ &gt; 0 ) \mu,\sigma(\sigma&gt;0) μ,σ(σ>0)为常数,则称 X X X服从参数为 μ , σ \mu,\sigma μ,σ的正太/高斯分布,记为 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2).
性质:

  • f ( x ) ≥ 0 f(x)\ge 0 f(x)0
  • ∫ − ∞ ∞ f ( x ) d x = 1 \int_{-\infty}^{\infty}f(x)dx=1 f(x)dx=1

下图为均值为 μ , 均 方 根 为 σ \mu,均方根为\sigma μ,σ的高斯分布图,峰值最大值为 f ( x ) m a x = 1 2 π σ , x = μ . f(x)_{max}=\frac{1}{\sqrt{2\pi}\sigma}, x=\mu. f(x)max=2π σ1,x=μ.
在这里插入图片描述
特点:

  • 如果固定方差 σ 2 \sigma^2 σ2, 改变参数 μ \mu μ,则正太曲线沿着 x x x轴平行移动,而图形的形状不改变。
    在这里插入图片描述
    这个问题很容易想明白,因为均值 μ \mu μ是跟 ( x − μ ) (x-\mu) (xμ)一起的,因此 ( x − ( μ + δ ) ) = ( ( x − δ ) − μ ) (x-(\mu+\delta))=((x-\delta)-\mu) (x(μ+δ))=((xδ)μ), 即对 x x x做了平移处理。
import numpy as np
import matplotlib.pyplot as plt
import mpl_toolkits.axisartist as axisartist#定义坐标轴函数
def setup_axes(fig, rect):ax = axisartist.Subplot(fig, rect)fig.add_axes(ax)ax.set_ylim(-.2, 1.2)#自定义刻度
#    ax.set_yticks([-10, 0,9])ax.set_xlim(-10,10)ax.axis[:].set_visible(False)#第2条线,即y轴,经过x=0的点ax.axis["y"] = ax.new_floating_axis(1, 0)ax.axis["y"].set_axisline_style("-|>", size=1.5)
#    第一条线,x轴,经过y=0的点ax.axis["x"] = ax.new_floating_axis(0, 0)ax.axis["x"].set_axisline_style("-|>", size=1.5)return(ax)def gaussian(x,mu,sigma):f_x = np.exp(-np.power(x-mu, 2.)/(2*np.power(sigma,2.)))return(f_x)#设置画布
fig = plt.figure(figsize=(8, 8)) #建议可以直接plt.figure()不定义大小
ax1 = setup_axes(fig, 111)
ax1.axis["x"].set_axis_direction("bottom")
ax1.axis['y'].set_axis_direction('right')#在已经定义好的画布上加入高斯函数x_values = np.linspace(-20,20,2000)
for mu,sigma in [(2,3),(3,3),(4,3)]:plt.plot(x_values,gaussian(x_values,mu,sigma),label=r'$\mu=$'+str(mu)+',$\sigma^2=3$')plt.show()
  • 如果固定 μ \mu μ, 改变参数 σ \sigma σ,由于峰值最大值为 f ( x ) m a x = 1 2 π σ f(x)_{max}=\frac{1}{\sqrt{2\pi}\sigma} f(x)max=2π σ1,所以 σ \sigma σ变小则图形“尖瘦”,反之“矮胖”
    在这里插入图片描述
for mu,sigma in [(2,0.5),(2,2),(2,3)]:plt.plot(x_values,gaussian(x_values,mu,sigma),label=r'$\mu=2$'+',$\sigma^2=$'+str(sigma**2))

1.2 标准正太分布

特别的, 当 μ = 0 , σ = 1 \mu=0,\sigma=1 μ=0,σ=1时随机变量 X X X服从标准正太分布,记为 X ∼ N ( 0 , 1 ) X\sim N(0,1) XN(0,1),分布密度和分布函数为:
f ( x ) = 1 2 π e − x 2 2 , − ∞ &lt; x &lt; ∞ f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}, -\infty&lt;x&lt;\infty f(x)=2π 1e2x2,<x<
F ( x ) = 1 2 π ∫ − ∞ x e − t 2 2 d t , − ∞ &lt; x &lt; ∞ F(x)=\frac{1}{\sqrt{2\pi}}\int_{-\infty}^{x}e^{-\frac{t^2}{2}}dt,- \infty&lt;x&lt;\infty F(x)=2π 1xe2t2dt,<x<
注意分布密度函数 F ( x ) F(x) F(x) x x x的函数而不是 t t t的函数,因为 t t t被积分掉了,而 x x x才是变化的量。
一般的,对于 X ∼ N ( μ , σ 2 ) X\sim N(\mu,\sigma^2) XN(μ,σ2)的分布函数,可通过线性变换化成标准正太分布形式。
F ( x ) = ∫ − ∞ x 1 σ 2 π e − ( t − μ ) 2 2 σ 2 d t F(x)=\int_{-\infty}^{x}\frac{1}{\sigma\sqrt{2\pi}}e^{-\frac{(t-\mu)^2}{2\sigma^2}}dt F(x)=xσ2π 1e2σ2(tμ)2dt
y = t − u σ y=\frac{t-u}{\sigma} y=σtu,可得
F ( x ) = ∫ − ∞ x − μ σ 1 2 π e − y 2 2 d y F(x)=\int_{-\infty}^{\frac{x-\mu}{\sigma}}\frac{1}{\sqrt{2\pi}}e^{-\frac{y^2}{2}}dy F(x)=σxμ2π 1e2y2dy
(上面利用 d y = d ( t − μ σ ) = d t σ dy=d(\frac{t-\mu}{\sigma})=d\frac{t}{\sigma} dy=d(σtμ)=dσt,因为后者是常数为零;当 t = x 时 , y = x − μ σ t=x时,y=\frac{x-\mu}{\sigma} t=xy=σxμ,这是上限)
所以由上式可以看到 y ∼ N ( 0 , 1 ) y\sim N(0,1) yN(0,1),即y服从标准正太分布
(P276,高数三)

1.3 numpy中使用正太分布

可以参考这篇博客:numpy random --mr.cat博文

2 多元高斯分布

可以参考这篇博文多元高斯分布,用google浏览器打开,否则会有些公式不能显示

2.1 独立多元/维高斯分布

这一部分将以图片形式引用这篇博文多元高斯分布,感谢博主,建议大家查看原文,因为写的很好。
在这里插入图片描述
这里 z 2 z^2 z2之所以可以写成 U Σ U T U\Sigma U^T UΣUT的形式,即进行奇异值分解,是因为 z 2 z^2 z2是二次型。强烈建议看一下这个博文如何理解二次型,简单说,二次型就是 f ( x , y ) f(x,y) f(x,y)变量中每一项的 x 和 y x和y xy的幂次相加等于2.如下图
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
(注意:在上面的图片中,不相关的二维正太分布每个截面都是圆形,表示不相关)

即,在一元标准正太分布中,分布密度为
(2.1.1) f ( x ) = 1 2 π e − x 2 2 , − ∞ &lt; x &lt; ∞ , f(x)=\frac{1}{\sqrt{2\pi}}e^{-\frac{x^2}{2}}, -\infty&lt;x&lt;\infty, \tag{2.1.1} f(x)=2π 1e2x2,<x<,(2.1.1)
而在 n n n元标准正太分布中,分布密度为
(2.1.2) f ( z ) = 1 ( 2 π ) n σ z e − z 2 2 , σ z = σ 1 σ 2 … σ n , f(z)=\frac{1}{\left(\sqrt{2\pi}\right)^n\sigma_z}e^{-\frac{z^2}{2}}, \sigma_z=\sigma_1\sigma_2\ldots \sigma_n,\tag{2.1.2} f(z)=(2π )nσz1e2z2,σz=σ1σ2σn,(2.1.2)
所以,需要记住的是,最一般的 n n n维高斯分布密度函数为
(2.1.3) f ( z ) = 1 ( 2 π ) n ∣ Σ ∣ 1 / 2 e − ( x − μ x ) T ( Σ ) − 1 ( x − μ x ) 2 , f(z)=\frac{1}{\left(\sqrt{2\pi}\right)^n|\Sigma|^{1/2}}e^{-\frac{(x-\mu_x)^T(\Sigma)^{-1}(x-\mu_x)}{2}},\tag{2.1.3} f(z)=(2π )nΣ1/21e2(xμx)T(Σ)1(xμx)(2.1.3)
( x − μ x ) T = [ ( x 1 − μ x 1 ) ( x 2 − μ x 2 ) … ] 是 行 矩 阵 (x-\mu_x)^T=[(x_1-\mu_{x_1}) (x_2-\mu_{x_2})\ldots] 是行矩阵 (xμx)T=[(x1μx1)(x2μx2)]
Σ 是 协 方 差 矩 阵 \Sigma是协方差矩阵 Σ以2维矩阵为例, Σ \Sigma Σ的表达式为
在这里插入图片描述

2.2 举例-画2维独立不相关高斯图

即上面 ( 2.1.2 ) (2.1.2) (2.1.2) n = 2 n=2 n=2的情况
(2.2.1) f ( x ) = 1 ( 2 π ) 2 σ 1 σ 2 e − ( x 1 − μ 1 ) 2 2 σ 1 2 − ( x 2 − μ 2 ) 2 2 σ 2 2 , f(x)=\frac{1}{\left(\sqrt{2\pi}\right)^2\sigma_1\sigma_2}e^{-\frac{(x_1-\mu_1)^2}{2\sigma_1^2}-\frac{(x_2-\mu_2)^2}{2\sigma_2^2}},\tag{2.2.1} f(x)=(2π )2σ1σ21e2σ12(x1μ1)22σ22(x2μ2)2,(2.2.1)
在这里插入图片描述

import numpy as np
import matplotlib.pyplot as plt
import mpl_toolkits.axisartist as axisartist
from mpl_toolkits.mplot3d import Axes3D #画三维图不可少
from matplotlib import cm  #cm 是colormap的简写#定义坐标轴函数
def setup_axes(fig, rect):ax = axisartist.Subplot(fig, rect)fig.add_axes(ax)ax.set_ylim(-.2, 1.2)#自定义刻度
#    ax.set_yticks([-10, 0,9])ax.set_xlim(-10,10)ax.axis[:].set_visible(False)#第2条线,即y轴,经过x=0的点ax.axis["y"] = ax.new_floating_axis(1, 0)ax.axis["y"].set_axisline_style("-|>", size=1.5)
#    第一条线,x轴,经过y=0的点ax.axis["x"] = ax.new_floating_axis(0, 0)ax.axis["x"].set_axisline_style("-|>", size=1.5)return(ax)
# 1_dimension gaussian function
def gaussian(x,mu,sigma):f_x = 1/(sigma*np.sqrt(2*np.pi))*np.exp(-np.power(x-mu, 2.)/(2*np.power(sigma,2.)))return(f_x)# 2_dimension gaussian function
def gaussian_2(x,y,mu_x,mu_y,sigma_x,sigma_y):f_x_y = 1/(sigma_x*sigma_y*(np.sqrt(2*np.pi))**2)*np.exp(-np.power\(x-mu_x, 2.)/(2*np.power(sigma_x,2.))-np.power(y-mu_y, 2.)/\(2*np.power(sigma_y,2.)))return(f_x_y)#设置2维表格
x_values = np.linspace(-5,5,2000)
y_values = np.linspace(-5,5,2000)
X,Y = np.meshgrid(x_values,y_values)
#高斯函数
mu_x,mu_y,sigma_x,sigma_y = 0,0,0.8,0.8
F_x_y = gaussian_2(X,Y,mu_x,mu_y,sigma_x,sigma_y)
#显示三维图
fig = plt.figure()
ax = plt.gca(projection='3d')
ax.plot_surface(X,Y,F_x_y,cmap='jet')
# 显示等高线图
#ax.contour3D(X,Y,F_x_y,50,cmap='jet')
# 显示2d等高线图,画8条线
# plt.contour(X,Y,F_x_y,8)

如果画成平面上的等高线图会更好理解,如下图,是一个个圆,也就是无相关

    ax.set_ylim(-4, 4)#自定义刻度
#    ax.set_yticks([-10, 0,9])ax.set_xlim(-4,4)
#设置画布
fig = plt.figure(figsize=(8, 8)) #建议可以直接plt.figure()不定义大小
ax1 = setup_axes(fig, 111)
ax1.axis["x"].set_axis_direction("bottom")
ax1.axis['y'].set_axis_direction('right')
# 显示2d等高线图,画8条线
plt.contour(X,Y,F_x_y,8)

在这里插入图片描述

2.3 相关系数

这里参考高数三P342.
定义:设二维随机向量 ( X , Y ) (X,Y) (X,Y)的方差 D X &gt; 0 , D Y &gt; 0 DX&gt;0, DY&gt;0 DX>0,DY>0,协方差 C o v ( X , Y ) Cov(X,Y) Cov(X,Y)都存在,则称
ρ X , Y = C o v ( X , Y ) D X D Y = C o v ( X , Y ) σ X σ Y \rho_{X,Y}=\frac{Cov(X,Y)}{\sqrt{DX}\sqrt{DY}}=\frac{Cov(X,Y)}{\sigma_X\sigma_Y} ρX,Y=DX DY Cov(X,Y)=σXσYCov(X,Y)
为随机变量 X 和 Y X和Y XY的相关系数
性质:

  • ∣ ρ X Y ∣ ≤ 1 |\rho_{XY}|\leq1 ρXY1
  • ρ \rho ρ是可以为负数的
  • ρ 越 接 近 1 \rho越接近1 ρ1表明相关程度越大, ρ = 1 \rho=1 ρ=1表明随机点 ( X , Y ) (X,Y) (X,Y) y = a x + b y=ax+b y=ax+b线上; ρ = 0 \rho=0 ρ=0表示不相关,此时协方差=0

2.3 举例-画2维不独立相关高斯图

协方差矩阵 Σ \Sigma Σ的形式为 (2.3,1) \tag{2.3,1} (2.3,1)
在这里插入图片描述

对角线上是方差,其他是协方差,当随机变量之间不独立的时候,协方差是不为零的。上面的协方差矩阵可以写成 (2.3,2) \tag{2.3,2} (2.3,2)
在这里插入图片描述
公式 ( 2.1.3 ) (2.1.3) (2.1.3)考虑相关时, ρ \rho ρ不等于0,此时协方差矩阵 Σ \Sigma Σ ( 2.3.2 ) (2.3.2) (2.3.2)的形式,因此分布密度函数为
(2.3.3) f ( x ) = 1 2 π σ 1 σ 2 1 − ρ 2 e − 1 2 ( 1 − ρ 2 ) [ ( x 1 − μ 1 ) 2 σ 1 2 − 2 ρ ( x − μ 1 ) ( x − μ 2 ) σ 1 σ 2 + ( x 2 − μ 2 ) 2 σ 2 2 ] f(x)=\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}}e^{-\frac{1}{2(1-\rho^2)}\left[\frac{(x_1-\mu_1)^2}{\sigma_1^2}-2\rho\frac{(x-\mu_1)(x-\mu_2)}{\sigma_1\sigma_2}+\frac{(x_2-\mu_2)^2}{\sigma_2^2}\right]}\tag{2.3.3} f(x)=2πσ1σ21ρ2 1e2(1ρ2)1[σ12(x1μ1)22ρσ1σ2(xμ1)(xμ2)+σ22(x2μ2)2](2.3.3)
过程如下:
在这里插入图片描述
现在,画出2维高斯分布相关图
现在画出几种相关图,首先看一下三维图

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述


http://chatgpt.dhexx.cn/article/pikPwK4X.shtml

相关文章

卡方分布(Chi-Square Distribution)

1.卡方分布 在统计学中, 很多假设检验的检验统计量在原假设下服从卡方分布. 这种检验统计量服从卡方分布的假设检验适用于分类数据. Γ ( v 2 ) \Gamma(\frac{v}{2}) Γ(2v​)为伽马函数 检验此PDF的积分值是否为1&#xff1f; 自由度&#xff08;DoF&#xff09;的正式定义为…

卡方检验和卡方分布

什么是卡方检验 卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴&#xff0c;主要是比较两个及两个以上样本率( 构成比&#xff09;以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。 它在分类资料…

卡方分布分析与应用

卡方检验(chi-square&#xff0c;记为 χ2 检验)是统计学中常用来计数数据分析的方法&#xff0c;对于总体的分布不作任何假设&#xff0c;因此它属于非参数检验法中的一种。本博文从理论到实际应用去阐述卡方检验&#xff0c;最后用python语言去实现卡方分布的代码。 1. 卡方…

常见分布 的 数学期望以及方差公式

一、通用公式【数学期望】 1》求解数学期望 2》数学期望的性质 二、常用分布的期望与方差 1》精简版&#xff1a; 2》叨叨版&#xff1a;

期望、方差

一、期望和方差的定义 随机变量(Random Variable) X 是一个映射&#xff0c;把随机试验的结果与实数建立起了一一对应的关系。而期望与方差是随机变量的两个重要的数字特征。 1. 期望(Expectation, or expected value) 期望是度量一个随机变量取值的集中位置或平均水平的最基…

[考研数学]概率论难点总结:样本标准差,样本均值,均值的期望和方差,与t分布、卡方分布和F分布的关系及推导

首先需要清楚一件事情&#xff0c;样本均值为X拔(上面有个棍) 样本的均值是讲从总体中抽样&#xff0c;这些样本的均值&#xff0c;而均值是指所有样本的真实均值。 后面部分很好推导&#xff0c;将括号展开后&#xff0c;由三部分组成&#xff0c;中间的部分为2倍的样本和样本…

统计学——卡方检验和卡方分布

什么是卡方检验 卡方检验是一种用途很广的计数资料的假设检验方法。它属于非参数检验的范畴&#xff0c;主要是比较两个及两个以上样本率( 构成比&#xff09;以及两个分类变量的关联性分析。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题。 它在分类资料…

卡方分布与卡方检验

1.卡方分布 卡方分布(chi-square distribution, χ2 χ 2 -distribution)是概率统计里常用的一种概率分布&#xff0c;也是统计推断里应用最广泛的概率分布之一&#xff0c;在假设检验与置信区间的计算中经常能见到卡方分布的身影。 我们先来看看卡方分布的定义&#xff1a;…

卡方分布

卡方分布是抽样分布的一种。抽样分布其实与概率论中的大数定律有密切的关系。当关注的对象的概率不可知,意味着只知道数据,不知道其内在规律;另一方面,关注的对象是可以分解成多种因素的组合时,就引入了抽样分布。抽样分布是描述从多个随机变量中抽取数据并且加以组合后,…

你还记得吗,超重要的3大抽样分布?

你还记得吗&#xff0c;超重要的3大抽样分布&#xff1f; 原创2022-07-03 21:07爱阅读 三大抽样统计分布是指卡方分布&#xff08;χ2分布&#xff09;&#xff0c;t分布和F分布&#xff0c;是来自正态总体的三个常用的分布。 1、卡方分布 卡方分布是指符合标准正态分布的样…

卡方分布、方差分析

卡方分布&#xff1a; 首先我们先把现代数学中的数理统计中的卡方分布已经烂大街的定义先放下来&#xff0c;我先回到卡方检验的诞生的之地。 在1900年&#xff0c;皮尔森发表了著名的关于卡方检验的文章&#xff0c;该文章被认为是现代统计学的基石之一。在该文章中&#…

SVN汉化包安装后,没有出现对应的语言选项问题解决(附SVN1.12.1汉化包下载地址)

检查SVN与汉化包的版本是否一致 1、查看tortoise SVN的版本 2、在SVN的安装目录下&#xff0c;将对应版本的汉化包拷过去 注意&#xff0c;保证Languages目录下的文件都已删掉 3、双击安装汉化包&#xff0c;安装完成时&#xff0c;在出现的最后一个页面中&#xff0c;选中Con…

TortoiseSVN安装中文语言包

TortoiseSVN安装中文语言包 1.TortoiseSVN 1.14.0下载地址 下载网址&#xff1a;https://tortoisesvn.net/downloads.zh.html 2.安装 直接下一步 3.下载中文安装包 找到安装目录 在桌面空白处右击TortoiseSVN设置

SVN安装语言包后无中文

给svn下载了个语言包&#xff0c;但是安装后无反应&#xff0c;重启了下还是无反应。 后来看了一下svn版本&#xff0c;是12的下载的语言包是11的。就重新下一个版本一样的试试。结果ok了 下载安装ok去选择即可&#xff0c;我的安装后自动就选择了。 版本选择地址https://osd…

SVN:下载、安装和中文设置

一、SVN 下载 步骤1&#xff1a;点击下方链接进入 SVN 下载网址 下载网址&#xff1a;https://tortoisesvn.net/downloads.html 步骤2&#xff1a;点击下载 TortoiseSVN 1.14.3-64-bit 步骤3&#xff1a;点击下载 中文语言包 步骤4&#xff1a;下载完成 二、SVN 安装 步骤1…

SVN 汉化(官网下载汉化包)

这是网址 Downloads TortoiseSVN 看好版本 下滑 点击后他可能反应慢不用管等待

解决SVN语言包安装后无法出现下拉框选择

前言&#xff1a; 今天终于有空研究下SVN为啥安装完语言包后无法出现中文下拉框的问题&#xff0c;直接在官网下载语言包安装后也无效。。 看了网上好多教程都是让你删Language目录再安装的&#xff0c;结果也布星。。折磨。。。 然后想了下&#xff0c;干脆去官网对着版本号…

TortoiseSVN 安装中文语言包,SVN中文语言包

SVN中TortoiseSVN 是比较出门的一款SVN软件 TortoiseSVN 是Subversion 版本控制系统的一个免费开源客户端。 由于TortoiseSVN 默认是英文的&#xff1b;所以很多小伙伴可能有压力&#xff1b;那么这次我们来介绍一下怎么样安装中文的语言包 工具/原料 能上网的windows电脑一台 …

svn中文包

本篇文章主要给大家介绍svn怎么设置中文即svn中文语言包的安装教程。 重点&#xff1a;首先看下自己的版本:右键tortois svn ,点击关于&#xff0c;开源查看自己的版本&#xff0c;然后选择对应版本下载中文包 在之前的文章中已经给大家介绍了如何安装svn工具&#xff0c;但是由…

TortoiseSVN下载安装及配置中文语言包

目录 一、下载地址 三、安装 四、更换中文语言包 五、效果 一、下载地址 TortoiseSVN下载 博主提供的SVN资源下载 官网详图&#xff1a; 顺便下个中文语言包64位&#xff08;页面滚动往下拉就看到了&#xff09; 二、安装 2个下载包都是傻瓜式安装我就不多说了&#xff…