数学基础--高斯分布

article/2025/8/21 19:42:01

文章目录

      • 一、简介
      • 二 、一元高斯分布
      • 三、多元高斯分布
        • 1、独立多元高斯分布
        • 2、多元相关变量高斯分布

一、简介

 高斯分布是一种重要的模型,也被称作正态分布,其广泛应用与连续型随机变量的分布中。在数据分析领域中高斯分布占有重要地位。掌握高斯分布是学习数据分析的重要基础,下面就结合理论公式和其几何图形来阐述。
 高斯分布会在许多问题中产生。例如,对于一个一元实值向量,使熵取得最大值的是高斯分布;中心极限定理告诉我们:一组随机变量之和的概率分布随着和式中项的数量的增加而逐渐趋向于高斯分布。如果有N个均匀分布在区间 [ 0 , 1 ] [0,1] [0,1]的变量 x 1 , x 2 , . . . , x N x_1,x_2,...,x_N x1,x2,...,xN,其均值 1 N ∑ i = 1 i = N x i \frac{1}{N}\sum_{i=1}^{i=N}x_i N1i=1i=Nxi的分布,对于N很大时,这个分布趋向于高斯分布,当N增大时,其均值的分布如下图(图片来源于:《模式识别与机器学习》)所示。
在这里插入图片描述

二 、一元高斯分布

 若随机变量 X X X服从均值为 μ \mu μ,方差为 σ 2 \sigma^2 σ2的高斯分布,那么:
f ( x ; μ , σ ) = 1 σ ( 2 π ) 1 2 e x p ( − ( x − μ ) 2 2 σ 2 ) f(x;\mu,\sigma)= \dfrac{1}{\sigma(2\pi)^{\frac{1}{2}}}exp(-\dfrac{(x-\mu)^2}{2\sigma^2}) f(x;μ,σ)=σ(2π)211exp(2σ2(xμ)2)
 高斯分布的图形像钟一样,下图展示了一般正态分布的图形。其中 μ = 0 , σ = 1 \mu=0,\sigma=1 μ=0,σ=1

在这里插入图片描述

 对于一个非标准的正态分布,可以由标准正态分布经过以下3步变换得到:

  1. 将x向右移动u个单位
  2. 将密度函数x轴延展sigma倍
  3. 将函数密度图像y轴压缩 σ \sigma σ

 如果 X X X服从分布, X ∼ N ( μ , σ 2 ) X\thicksim N(\mu,\sigma^2) XN(μ,σ2),那么具有以下的性质:

  1. 如果 a , b a,b a,b是实数,那么 a X + b ∼ N ( a μ + b , ( a σ ) 2 ) aX+b\thicksim N(a\mu+b,(a\sigma)^2) aX+bN(aμ+b,(aσ)2)
  2. 如果 Y ∼ N ( μ y , σ y 2 ) Y\thicksim N(\mu_y,\sigma_y^2) YN(μy,σy2), X ∼ N ( μ x , σ x 2 ) X\thicksim N(\mu_x,\sigma_x^2) XN(μx,σx2),且 X , Y X,Y X,Y相互独立,那么 X + Y ∼ N ( μ x + μ y , σ x 2 + σ y 2 ) X+Y\thicksim N(\mu_x+\mu_y,\sigma_x^2+\sigma_y^2) X+YN(μx+μy,σx2+σy2), X − Y ∼ N ( μ x − μ y , σ x 2 + σ y 2 ) X-Y\thicksim N(\mu_x-\mu_y,\sigma_x^2+\sigma_y^2) XYN(μxμy,σx2+σy2)
  3. 如果 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn为独立标准正态分布,那么 X 1 2 + X 2 2 + . . . + X n 2 X_1^2+X_2^2+...+X_n^2 X12+X22+...+Xn2服从自由度为n的卡方分布。

三、多元高斯分布

1、独立多元高斯分布

  假设 n n n个变量 x = [ x 1 , x 2 , . . . , x n ] T \boldsymbol{x}=[x_1,x_2,...,x_n]^T x=[x1,x2,...,xn]T相互独立,且服从高斯分布,各个维度的均值 E ( x ) = [ u 1 , u 2 , . . . , u n ] T E(\boldsymbol{x})=[u_1,u_2,...,u_n]^T E(x)=[u1,u2,...,un]T ,方差 σ ( x ) = [ σ 1 , σ 2 , . . . , σ n ] T \sigma(\boldsymbol{x})=[\sigma_1,\sigma_2,...,\sigma_n]^T σ(x)=[σ1,σ2,...,σn]T,根据联合概率密度公式有:
f ( x ) = p ( x 1 , x 2 , . . . , x n ) = p ( x 1 ) p ( x 2 ) . . . p ( x n ) = 1 ( 2 π ) n σ 1 σ 2 . . . σ n e − ( x 1 − u 1 ) 2 2 σ 1 2 − ( x 2 − u 2 ) 2 2 σ 2 2 . . . − ( x n − u n ) 2 2 σ n 2 f(\boldsymbol{x})=p(x_1,x_2,...,x_n)=p(x_1)p(x_2)...p(x_n)=\dfrac{1}{(\sqrt{2\pi})^n\sigma_1\sigma_2...\sigma_n} e^{-\frac{(x_1-u_1)^2}{2\sigma_1^2}-\frac{(x_2-u_2)^2}{2\sigma_2^2}...-\frac{(x_n-u_n)^2}{2\sigma_n^2}} f(x)=p(x1,x2,...,xn)=p(x1)p(x2)...p(xn)=(2π )nσ1σ2...σn1e2σ12(x1u1)22σ22(x2u2)2...2σn2(xnun)2
  如果我们令:
z 2 = ( x 1 − u 1 ) 2 2 σ 1 2 + ( x 2 − u 2 ) 2 2 σ 2 2 . . . + ( x n − u n ) 2 2 σ n 2 , σ z = σ 1 σ 2 . . . σ n z^2=\frac{(x_1-u_1)^2}{2\sigma_1^2}+\frac{(x_2-u_2)^2}{2\sigma_2^2}...+\frac{(x_n-u_n)^2}{2\sigma_n^2} , \space\space\space\space\space\space\space\sigma_z=\sigma_1\sigma_2...\sigma_n z2=2σ12(x1u1)2+2σ22(x2u2)2...+2σn2(xnun)2,       σz=σ1σ2...σn
  我们有:
f ( z ) = 1 ( 2 π ) n 2 σ z e − z 2 f(z)= \dfrac{1}{(2\pi)^{\frac{n}{2}}\sigma_z}e^{-z^2} f(z)=(2π)2nσz1ez2
  使用矩阵的形式来表示的话,则有:
z 2 = [ x 1 − u 1 , x 2 − u 2 , . . . , x n − u n ] [ σ 1 − 2 0 0 . . . 0 0 σ 2 − 2 0 . . . 0 . . . . . . . . . . . . . . . . . . . . . 0 0 0 . . . σ n − 2 ] [ x 1 − u 1 , x 2 − u 2 , . . . , x n − u n ] T z^2=[x_1-u_1,x_2-u_2,...,x_n-u_n] \begin{bmatrix}\sigma_1^{-2} & 0 &0 &...& 0 \\ 0 & \sigma_2^{-2} & 0 & ...&0 \\ .&.&.&...&.\\.&.&.&...&.\\.&.&.&...&.\\0&0&0&...&\sigma_n^{-2} \end{bmatrix} [x_1-u_1,x_2-u_2,...,x_n-u_n]^T z2=[x1u1,x2u2,...,xnun]σ120...00σ22...000...0..................00...σn2[x1u1,x2u2,...,xnun]T
  定义符号:
x − u x = [ x 1 − u 1 , x 2 − u 2 , . . . , x n − u n ] T \boldsymbol{x-u_x} = [x_1-u_1,x_2-u_2,...,x_n-u_n]^T xux=[x1u1,x2u2,...,xnun]T

Σ = [ σ 1 2 0 0 . . . 0 0 σ 2 2 0 . . . 0 . . . . . . . . . . . . . . . . . . . . . 0 0 0 . . . σ n 2 ] \boldsymbol\Sigma= \begin{bmatrix}\sigma_1^{2} & 0 &0 &...& 0 \\ 0 & \sigma_2^{2} & 0 & ...&0 \\ .&.&.&...&.\\.&.&.&...&.\\.&.&.&...&.\\0&0&0&...&\sigma_n^{2} \end{bmatrix} Σ=σ120...00σ22...000...0..................00...σn2
σ z = ∣ Σ ∣ 1 2 \sigma_z=| \boldsymbol\Sigma|^{\frac{1}{2}} σz=Σ21

  变量代换可得:
f ( z ) = 1 ( 2 π ) n 2 σ z e − z 2 = 1 ( 2 π ) n 2 ∣ Σ ∣ 1 2 e ( x − u x ) T ( Σ ) − 1 ( x − u x ) f(z)= \dfrac{1}{(2\pi)^{\frac{n}{2}}\sigma_z}e^{-z^2}= \dfrac{1}{(2\pi)^{\frac{n}{2}}|\Sigma|^{\frac{1}{2}}}e^{\boldsymbol{(x-u_x)^T} (\boldsymbol\Sigma)^{-1} \boldsymbol{(x-u_x)}} f(z)=(2π)2nσz1ez2=(2π)2nΣ211e(xux)T(Σ)1(xux)
下面以 x = [ x 1 , x 2 ] \boldsymbol x=[x_1,x_2] x=[x1,x2] 为例,画出二元高斯分布在变量之间相互独立的图像:

  1.  当 u = [ 0 , 0 ] Σ = [ 5 0 0 5 ] \boldsymbol u=[0,0] \boldsymbol\Sigma=\begin{bmatrix}5&0 \\ 0 &5\end{bmatrix} u=[0,0]Σ=[5005]时:

    在这里插入图片描述

  2.  当 u = [ 0 , 0 ] Σ = [ 1 0 0 1 ] \boldsymbol u=[0,0] \boldsymbol\Sigma=\begin{bmatrix}1&0 \\ 0 &1\end{bmatrix} u=[0,0]Σ=[1001]时:


    在这里插入图片描述

  3.  当 u = [ 0 , 0 ] Σ = [ 5 0 0 1 ] \boldsymbol u=[0,0] \boldsymbol\Sigma=\begin{bmatrix}5&0 \\ 0 &1\end{bmatrix} u=[0,0]Σ=[5001]时:

    在这里插入图片描述

    1.  当 u = [ 0 , 0 ] Σ = [ 1 0 0 5 ] \boldsymbol u=[0,0] \boldsymbol\Sigma=\begin{bmatrix}1&0 \\ 0 &5\end{bmatrix} u=[0,0]Σ=[1005]时:
      在这里插入图片描述

 由上图可以看出,当变量之间相互独立的时候:

  1. 当协方差矩阵的特征值越小时,分布函数图像越高越尖。
  2. 当协方差矩阵的特征值相等时,分布函数图像在X1,X2面上的投影是圆形的。当特征值不相等时,分布函数图像在X1,X2面上的投影是椭圆形的,X1,X2相互独立时,椭圆的长轴和短轴平行与坐标轴。且变量对应的特征值越大,该变量分布的范围越分散,在二元高斯分布中,对应特征值大的变量在函数投影图像中对应的是椭圆的长轴。高维的高斯分布情况可以按照这个规律进行推广。

2、多元相关变量高斯分布

 当变量之间存在相关关系的时候,协方差矩阵不再是对角阵,而是一个对称的矩阵,矩阵的每个元素 σ i j 2 \sigma_{ij}^2 σij2表示变量 i , j i,j i,j的协方差。

  1.  当 u = [ 0 , 0 ] Σ = [ 5 1 1 1 ] \boldsymbol u=[0,0] \boldsymbol\Sigma=\begin{bmatrix}5&1 \\ 1&1\end{bmatrix} u=[0,0]Σ=[5111]时:
    在这里插入图片描述
  2.  当 u = [ 0 , 0 ] Σ = [ 1 2 2 5 ] \boldsymbol u=[0,0] \boldsymbol\Sigma=\begin{bmatrix}1&2 \\ 2 &5\end{bmatrix} u=[0,0]Σ=[1225]时:
    在这里插入图片描述

 从上面2个图像中可以看出,变量之间具有相关关系时,与变量之间相互独立最大的区别是,投影面的椭圆长短轴不再平行与坐标轴。
 如果我们将坐标轴X1,X2旋转一下,与椭圆的长短轴平行,如下图所示:

在这里插入图片描述

 由独立变量的二元高斯分布知,那么在新的坐标系下, x 1 ′ , x 2 ′ x_1',x_2' x1,x2是相互独立的。上述过程称作为去相关性,这也是经典的降维方法主成分分析PCA的基础。以下是新坐标系的求解和原坐标系上的点在新坐标系下的坐标数学表达。
 根据协方差矩阵的特征方程求解协方差矩阵的单位正交特征向量(先求出特征向量,再进行正交化与单位化),
Σ u i = λ i μ i \boldsymbol\Sigma u_i = \lambda_i\mu_i Σui=λiμi
  假设上式中 μ i = [ u i 1 , u i 2 ] T \mu_i=[u_{i1},u_{i2}]^T μi=[ui1,ui2]T已经被单位正交化,以二维高斯分布为例
U = [ u 11 u 21 u 12 u 22 ] \boldsymbol U=\begin{bmatrix}u_{11}&u_{21} \\ u_{12} &u_{22}\end{bmatrix} U=[u11u12u21u22]
 新坐标系的坐标轴为 μ 1 = [ u 11 , u 12 ] T \mu_1=[u_{11},u_{12}]^T μ1=[u11,u12]T μ 2 = [ u 21 , u 22 ] T \mu_2=[u_{21},u_{22}]^T μ2=[u21,u22]T
 新坐标系下,原坐标下下点的坐标为:
[ x 1 ′ x 2 ′ ] = U [ x 1 x 2 ] = [ u 11 u 21 u 12 u 22 ] [ x 1 x 2 ] \begin{bmatrix}x_1'\\x_2'\end{bmatrix} = \boldsymbol U\begin{bmatrix}x_1\\x_2\end{bmatrix}=\begin{bmatrix}u_{11}&u_{21} \\ u_{12} &u_{22}\end{bmatrix} \begin{bmatrix}x_1\\x_2\end{bmatrix} [x1x2]=U[x1x2]=[u11u12u21u22][x1x2]
此时 x 1 ′ , x 2 ′ x_1',x_2' x1,x2之间没有相关关系。


http://chatgpt.dhexx.cn/article/iD0kdZD6.shtml

相关文章

数学基础--高斯分布详解

1、简介 正态分布(Normal Distribution),又名高斯分布(Gaussian Distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。 约翰卡尔弗里德里希…

Latex学习(1)——latex中的字体颜色

格式: \textcolor{color}{text} 例子: \textcolor{white}{白色}\ \textcolor{linen}{亚麻色}\​ \textcolor{black}{黑色}\ \textcolor{grey}{灰色}\ \textcolor{lightgrey}{浅灰色}\ \textcolor{darkgrey}{深灰色}\​ \textcolor{red}{红色}\ \textcolo…

【LaTeX 教程】04. LaTeX 插入数学公式与符号

【LaTeX 教程】04. LaTeX 插入符号与数学公式 LaTeX 公式 我将把握最近文章里用到的数学公式格式都放上来供大家参考学习 首先 最简单的数学模式 $xxx$ %一个$符号,中间的内容是行内模式 $$xxx$$ %两个$符号,中间的内容是行间模式(行间模式会单独占…

【科普向】LaTeX简介(一篇极简的 LaTeX 介绍文章)

文章目录 LaTeX诞生背景TeX和LaTeXLaTeX主要功能文档结构数学公式公式块 我们平时在word里新建一个doc(x)文件后,输入内容,调整页边距、字体大小、行间距等待,然后交给打印机打印就可以了。 如果你写了一篇关于新疆棉花的文章,20…

用LaTex代码写数学公式

文章目录 公式符号1.上下标 ^ _2.分子分母 \frac{}{}3.根号 \sqrt4.极限 \lim\limits极限换行:\atop 5.积分 \int_下限^上限一重积分号 \int二重积分号 \iint三重积分号 \iiint封闭积分 \oint积分号变大 6.累加、累乘累加 \sum累乘 \prod\limits 7.戴帽符号 \hat{}、…

LaTeX新手半小时速成手册(不速成你打我

期末大作业LaTeX排版,一个学期没听课,学了b站半小时完成大作业。写此速成手册以作备忘。 b站链接:小风寒呐 1. primary 一篇论文最主要的构成,以中文为例 1.1 整体框架 1.1.1 声明类 相当于在说:“我想写一篇文章…

简述c语言中break的作用,c语言break什么意思?

break在一些计算机语言中是保留字,其作用大多情况下是终止上一层的循环,以C语言来说,break在switch(开关语句)中在执行一条case后跳出语句的作用。 1、 C语言中的break : break语句通常用在循环语句和开关语句中。当break用于开关…

c语言break能与if用吗,break可以用于if吗

break语句也可以用于if体内,它可退出if语句 可 对?reak 看似在if 语句中执行,如: for(s1;s2;s3) { if(b1)break; else s4; } 但事实上这里的break;是执行在for语句中的,跳出的是for语句。 即使输入 if(b1) 这也是跳出外层的for语句或switch语句而已。 此解答仅供参考。 b…

C++中break与continue的用法

根据break的用法,是在循环体内,强行结束循环的执行,也就是结束整个循环的过程,不再执行循环的条件是否成立,直接转向循环语句下面的语句。 continue的作用:在循环语句中,跳出本次循环中余下尚未…

UART的break信号

目录 1.TTL电平和RS232电平 2.UART的时序 3.break信号 4.如何检测break信号? 最近的一个项目用到了UART的break信号,在查资料的过程中,发现很多文章对break信号有介绍,但是都很简单,看了让人摸不着头脑&#xff0c…

c++ break语句

break语句 brea语句是用来跳出switch或者循环体结构的语句。循环语句中的break用法与switch类似&#xff0c;可以直接忽视条件判断而直接跳出循环。 break在for循环中的用法 #include<iostream> using namespace std;//break语句int main() {for ( int i0;i<10;i){…

break和continue

break和continue的作用和区别是什么&#xff1f; 一、break和continue的作用 二、break和continue的区别 三、案例分析 一、break和continue的作用 break和continue都是用来控制循环结构的&#xff0c;主要作用是停止循环。 二、break和continue的区别 1、break用于跳出一…

break关键字

1、break关键字用于 while、for 循环时&#xff0c;会终止循环而执行整个循环语句后面的代码。break 关键字通常和 if 语句一起使用&#xff0c;即满足条件时便跳出循环。这里强调一下&#xff0c;如果存在多层循环的时候&#xff0c;break只会跳出当前循环&#xff1b;下面是测…

break用法

参考例程 1 -> 用于for循环 for(;;){// Afor(;;) {// Bbreak; // 只跳出B的for循环}}参考例程 2 -> 用于switch int i;switch&#xff08;i&#xff09;{case 1:break; // 跳出Switchcase 2:break; // 跳出Switchdefault:break; // 跳出Switch}总结 1、break 在一些…

break 通过自定义标签跳到指定位置

实现比较简单&#xff0c;但是不常用&#xff0c;所以本篇博客作为一个笔记使用&#xff0c;因代码简单&#xff0c;直接粘贴代码和运行结果 public class Tets {public static void main(String[] args) {b:for(;;){System.out.println("bbbbbbbbbbbbbbbbbbbbbb");…

c#语言break语句用法,C# break语句

C# 中的break语句主要有两个用法&#xff1a; 在循环中使用&#xff0c;当循环中遇到break语句时&#xff0c;循环将立即终止&#xff0c;程序控制在循环之后的下一个语句中恢复。 它可以用于终止switch语句中的case语句。 如果使用嵌套循环(即在一个循环中使用另一个循环)&…

matlab中break语句,MATLAB break语句

本文概述 break语句终止for循环或while循环的执行。当遇到break语句时, 执行将继续循环外的下一条语句。在嵌套循环中, break仅存在于最内部的循环中。 句法 break 以下是在MATLAB中使用break语句时的要点 break关键字用于定义break语句。 break语句终止或停止for或while循环的…

break语句

break语句 break译为&#xff1a;中断 定理&#xff1a; 1、break语句可以结束当前循环的执行 2、执行完break语句后&#xff0c;循环体中位于break语句后面的语句就不会被执行 3、在多重循环中&#xff0c;break语句只向外跳一层 只能在循环体内或switch语句中使用break语句…

break的相关知识

break&#xff0c;continue的相关知识 &#xff08;1&#xff09;只能在循环体内和switch语句体内使用break&#xff0c;注意在循环体内即可&#xff0c;比如循环体内的if语句中也可用break&#xff0c;其实通常break语句与if语句联用&#xff0c;用于满足某种条件直接退出循环…