正态分布中的半正定矩阵(协方差矩阵)

article/2025/9/20 3:01:55

正态分布中的半正定矩阵(协方差矩阵)

1.什么是正定矩阵和半正定矩阵

我们学习半正定矩阵前,得先了解,正定矩阵与半正定矩阵的关系以及什么是正定矩阵。这里先学习什么是二次型。

首先给出二次型的定义
定义1:设P为数域, a i j ∈ P , i , j = 1 , 2 , … , n a_ij∈P,i,j=1,2,…,n aijP,i,j=1,2,,n,n个数字x_1,x_2…,x_n的二次齐次多项式。
在这里插入图片描述

称为数域P上的一个n元二次型
而这个式子可进一步可写成:
在这里插入图片描述
由于约定二次型中
在这里插入图片描述
,可知 x i x j = x j x i x_i x_j=x_j x_i xixj=xjxi,有
在这里插入图片描述
由于笔者数学基础差,在此记录一下转化过程
在这里插入图片描述
将上式子的系数a排列成一个n×n矩阵
在这里插入图片描述
这个矩阵就称为二次型的矩阵,由于上面我们所约定 a i j = a j i , i , j = 1 , 2 , … , n a_ij=a_ji,i,j=1,2,…,n aij=aji,i,j=1,2,,n,由此可知 A ′ = A A'=A A=A

意思是:转置矩阵=原矩阵
这种转置矩阵和原矩阵相等的矩阵称为对称矩阵,即二次型矩阵都是对称矩阵。

这个式子可以进一步化成以下形式:
原式为:
在这里插入图片描述
把x提出来
在这里插入图片描述
再次转化成矩阵形式在这里插入图片描述
再把矩阵中x提取出来得到
在这里插入图片描述
其中
在这里插入图片描述
我们称 f(x)=X’AX 为二次型的矩形形式,其中实对称矩阵A称为该二次型的矩阵。
二次型f称为实对称矩阵A的二次型。实对称矩阵A的秩称为:二次型的秩。于是,二次型f与其实对称矩阵A之间有一一对应关系。

∀ x ∈ R n 且 𝑥 ≠ 0 { X T A X > 0 ( 1 ) X T A X ≥ 0 ( 2 ) ∀x∈R^n且𝑥≠0\left\{ \begin{aligned} X^T AX>0 (1) \\ X^T AX≥0 (2) \\ \end{aligned} \right. xRnx=0{XTAX>0(1)XTAX0(2)
其中(1)式成立,则称为正定矩阵,(2)式成立则称为半正定矩阵。

其中x^T Ax为二次型的矩形形式。

举一个简单的例子:
(1)假设
A = [ 1 0 0 1 ] , x = [ x 1 x 2 ] A=\left[ \begin{matrix} 1 & 0 \\0 & 1 \\ \end{matrix} \right], x=\left[ \begin{matrix} x_1 \\x_2\\ \end{matrix}\right] A=[1001],x=[x1x2]

X T A X = x 1 2 + x 1 2 > 0 X^T AX=x_1^2+x_1^2>0 XTAX=x12+x12>0。满足这一条件称为正定矩阵。

(2)假设

A = [ 1 1 1 1 ] , x = [ x 1 x 2 ] A=\left[ \begin{matrix} 1 & 1 \\1 & 1 \\ \end{matrix} \right], x=\left[ \begin{matrix} x_1 \\x_2\\ \end{matrix}\right] A=[1111],x=[x1x2]
X T A X = x 1 2 + x 1 2 + 2 x 1 x 2 = ( x 1 + x 2 ) 2 ≥ 0 X^T AX=x_1^2+x_1^2+2x_1 x_2=(x_1+x_2 )^2≥0 XTAX=x12+x12+2x1x2=(x1+x2)20。满足这一条件称为半正定矩阵。

2.正定矩阵和半正定矩阵意义

在一维中,二次函数表达形式为
y = a x 2 + b x + c y=ax^2+bx+c y=ax2+bx+c,
a > 0 a>0 a>0时,开口向上,凸函数,存在最低点。当 a < 0 a<0 a<0时,开口向下,凹函数,存在最高点。
输入:x 单元(一维下的值)
输出:y 单值(一维下的值)

在多维中,二次函数的输入x数为矩阵形式,例如:
输入: A = [ x 1 x 2 ⋮ x n m ] , 多 元 ( 多 位 下 的 矩 阵 ) A=\left[ \begin{matrix} x_1 \\x_2 \\\vdots\\x_n \end{matrix}m \right],多元(多位下的矩阵) A=x1x2xnm,
输出:y 单值(一维下的值)

这里我们可以得到一个结论,
假设A矩阵为正定矩阵且对称,则所有特征值≥0;

个人总结推导:
A A A矩阵为正定时, ∀ x ∈ R n ∀x∈R^n xRn x ≠ 0 , X T A X > 0 x≠0,X^T AX>0 x=0,XTAX>0
A A A矩阵为对称时, A T = A A^T=A AT=A,且必有正交矩阵 P T A P = ∧ P^T AP=∧ PTAP=,其中 ∧ ∧ 是以 A A A n n n个特征值为对角元素的对角矩阵。对应于不同特征值的特征向量正交,故这 n n n个单位特征向量两两正交。以它们为列向量构成正交矩阵P,则可得到: P T A P = P T ∧ P = ∧ P^T AP=P^T∧P=∧ PTAP=PTP=
即可得: A = P T ∧ P A=P^T∧P A=PTP

A = P T ∧ P 代 入 X T A X > 0 A=P^T∧P代入X^T AX>0 A=PTPXTAX>0,可得: X T P T ∧ P X > 0 X^T P^T∧PX>0 XTPTPX>0
假设 y = P T X , y T = P X T , P T y=P^T X,y^T=PX^T, P^T y=PTX,yT=PXT,PT为一个可逆的n×n矩阵。则 X T P ∧ P T X > 0 X^T P∧P^T X>0 XTPPTX>0可化为 y T ∧ y > 0 y^T∧y>0 yTy>0
因为
∧ = [ λ 1 ⋯ 0 ⋮ ⋱ ⋮ 0 ⋯ λ 1 ] ∧=\left[ \begin{matrix} λ_1 & \cdots&0 \\ \vdots & \ddots &\vdots \\0&\cdots&λ_1 \end{matrix} \right] =λ100λ1

y T ∧ y = λ 1 y 1 2 + λ 2 y 2 2 + ⋯ + λ n y n 2 > 0 y^T∧y=λ_1 y_1^2+λ_2 y_2^2+⋯+λ_n y_n^2>0 yTy=λ1y12+λ2y22++λnyn2>0,可得到当取任取 y i = 1 y_i=1 yi=1,其他元素都为0时,可得到 λ i > 0 λ_i>0 λi>0

个人理解:对于 x ≠ 0 x≠0 x=0,其 y T ∧ y > 0 y^T∧y>0 yTy>0的情况下, y T y^T yT y y y都不等于0。且 y T y^T yT y y y相乘都为正,所以 ∧ ∧ 的值应大于0,即所有的 λ i λ_i λi>0。

同理可推出半正定矩阵中的特征值。
假设 A A A矩阵为半正定矩阵,则所有特征值≥0;

3.半正定矩阵

上面已经介绍了半正定矩阵,下面证明协方差矩阵是半正定矩阵。
首先先理解什么是协方差矩阵
Y = [ ( y 1 , y 2 , y 3 , … , y n ) ] T Y=[(y_1,y_2,y_3,…,y_n)]^T Y=[(y1,y2,y3,,yn)]T n n n维随机变量,称矩阵为

在这里插入图片描述
要证明 ∑ ∑ 为半正定矩阵,需要证明对于任意 Y = [ ( y 1 , y 2 , y 3 , … , y n ) ] T Y=[(y_1,y_2,y_3,…,y_n)]^T Y=[(y1,y2,y3,,yn)]T n n n维随机变量,有 Y T ∑ Y ≥ 0 Y^T∑Y≥0 YTY0

先计算Y^T∑部分
在这里插入图片描述
在这里插入图片描述
在把 X X X加进去,计算 Y T ∑ Y Y^T∑Y YTY部分在这里插入图片描述
假设
在这里插入图片描述
由此我们可以得到: Y T ∑ Y = E ( W 2 ) > 0 Y^T∑Y=E(W^2)>0 YTY=E(W2)>0

所以我们可以理解了在概率机器人中多元正太分布的密度函数:
在这里插入图片描述
其中,μ数均值矢量,∑是一个半正定矩阵也称协方差矩阵。


http://chatgpt.dhexx.cn/article/51Lsxu5L.shtml

相关文章

什么是正定矩阵,什么是负定矩阵?判别方法

一、负定矩阵判别方法有&#xff1a; 1、 A 的特征值都小于0 2、A的k阶顺序主子式 * (-1)^k > 0 &#xff08;也就是偶数阶主子式为正&#xff0c;奇数阶主子式为负。 顺序主子式是行列式&#xff0c;第k阶顺序主子式就是矩阵的前k行和前k列组成的行列式&#xff0c; &#…

半正定矩阵理解

半正定与正定矩阵同意用半正定矩阵来事例&#xff1a; 首先半正定矩阵定义为: 其中X 是向量&#xff0c;M 是变换矩阵 我们换一个思路看这个问题&#xff0c;矩阵变换中&#xff0c; 代表对向量 X进行变换&#xff0c;我们假设变换后的向量为Y&#xff0c;记做YMX。于是半正…

正定矩阵及其系列性质

1. 正定矩阵的定义 广义定义&#xff1a;设M是n阶方阵&#xff0c;如果对任何非零向量z&#xff0c;都有&#xff0c;则称M为正定矩阵&#xff1b; 狭义定义&#xff1a;一个n阶的实对称矩阵M是正定的的条件是当且仅当对于所有的非零实系数向量z&#xff0c;都有。 2. 正定矩…

半正定矩阵 正定

矩阵A正定是指,对任意的X≠0恒有X^TAX&#xff1e;0 矩阵A半正定是指,对任意的X≠0恒有X^TAX≥0 X^T代表X的转置 对一般的矩阵来说&#xff0c;要把矩阵化成标准型才可以这样说。一个矩阵是正定的是指该矩阵对应的实 二次型f&#xff08;x1,x2,...,xn&#xff09;对任意的一组不…

「正定矩阵」和「半正定矩阵」

在众多的机器学习模型中&#xff0c;线性代数的身影无处不在&#xff0c;当然&#xff0c;我们也会时常碰到线性代数中的正定矩阵和半正定矩阵。例如&#xff0c;多元正态分布的协方差矩阵要求是半正定的。 ------------------------------------------ 1. 基本的定义 正定和半…

正定矩阵与半正定矩阵

作者&#xff1a;cwaar链接&#xff1a;https://www.zhihu.com/question/22098422/answer/35874276来源&#xff1a;知乎 首先半正定矩阵定义为: 其中 X 是向量&#xff0c;M 是变换矩阵。 我们换一个思路看这个问题&#xff0c;矩阵变换中&#xff0c; 代表对向量 X 进行变换…

证明:协方差矩阵是半正定矩阵

好多年没看过linear algebra…… 感谢百度知道网友“xtimz”提供的答案。 写成分量形式就是这样。 &#xff08;看不清楚的话&#xff0c;可以对着这张图点右键&#xff0c;然后在新地址中打开该图片&#xff0c;就可以放大了。或者直接保存到本地再放大查看也行。&#xff0…

【线性代数】理解正定矩阵和半正定矩阵

目录 1 前言2 定义3 从几何的角度理解4 参考文献 1 前言 内容为自己的学习总结&#xff0c;其中多有借鉴他人的地方&#xff0c;最后一并给出链接。 2 定义 在机器学习和谱图理论的学习中&#xff0c;总会用到正定矩阵半正定矩阵概念&#xff0c;了解它们的概念是十分必要的。…

矩阵的 正定与半正定

先不慌&#xff0c;我们要搞清楚正定与半正定先熟悉几个基本的概念 一&#xff1a;矩阵的基 最简单的理解就是&#xff1a;线性变换就是线性映射&#xff0c;矩阵只不过是线性映射的系数而已。所以&#xff0c;选定基底实际是选定坐标轴&#xff08;不一定正交&#xff09;。我…

正定矩阵、负定矩阵、半正定矩阵、半负定矩阵

正定矩阵、负定矩阵、半正定矩阵、半负定矩阵 载▼ 1.正定矩阵 一个 nn 的实 对称矩阵 M 是 正定 的&#xff0c; 当且仅当 对于所有的非零实系数 向量 z &#xff0c;都有 zTMz > 0 。其中 z T 表示 z 的 转置 。 2.负定矩阵 与正定矩阵相对应的&#xff0c;一个nn的埃尔…

正定矩阵和半正定矩阵

定义 正定和半正定这两个词的英文分别是positive definite和positive semi-definite&#xff0c;其中&#xff0c;definite是一个形容词&#xff0c;表示“明确的、确定的”等意思。 【定义1】给定一个大小为的实对称矩阵 &#xff0c;若对于任意长度为 的非零向量 &#x…

半正定矩阵和正定矩阵的一些理解和补充

文章目录 一&#xff1a;半正定矩阵二&#xff1a;正定矩阵3.直观理解正定、半正定矩阵 一&#xff1a;半正定矩阵 设A是实对称矩阵。如果对任意的实非零列向量x有xTAx≥0&#xff0c;就称A为半正定矩阵。 等价条件&#xff1a; 1. A是半正定的…

半正定矩阵

1.【定义】给定一个大小为 n n nx n n n的实对称矩阵A,若对于任意长度为 n n n的向量 x x x,有 x T A x ≥ 0 x^{T}Ax \geq 0 xTAx≥0恒成立&#xff0c;则矩阵A是一个半正定矩阵。 半正定矩阵包含正定矩阵&#xff08;正定矩阵是 x T A x > 0 x^{T}Ax > 0 xTAx>0&…

正定矩阵(Positive Definite Matrices)、半正定矩阵(Positive Semidefinite Matrices)

正定矩阵、半正定矩阵 1.正定矩阵、半正定矩阵1.1 正定矩阵1.1.1 判断正定矩阵 1.2 半正定矩阵1.2.1 判定半正定矩阵 1.3 椭圆 a x 2 2 b x y c y 2 1 ax^22bxycy^21 ax22bxycy211.3.1 与对称矩阵 S S S有关的椭圆1.3.2 与特征值矩阵 Λ \Lambda Λ有关的椭圆 1.4 重要应用…

正定矩阵与半正定矩阵定义与判别

1.正定矩阵和半正定矩阵 若所有特征值均大于零&#xff0c;则称为正定。 定义:A是n阶方阵&#xff0c;如果对任何非零向量x&#xff0c;都有>0,其中表示x的转置&#xff0c;就称A为正定矩阵。 性质: 正定矩阵的行列式恒为正&#xff1b;实对称矩阵AA正定当且仅当AA与单位…

C++求解汉明距离

目录 汉明距离介绍汉明距离应用解法1&#xff1a;Brian Kernighan算法解法2解法3 汉明距离介绍 leetcode 461 汉明距离&#xff0c;难度&#xff1a;简单 两个整数之间的 汉明距离 指的是这两个数字对应二进制位不同的位置的数目。 给你两个整数 x 和 y&#xff0c;计算并返…

计算快速汉明距离

汉明距离,作为一种衡量特征距离的计算方法,在很多场合都有应用,其主要思想是找到两个特征之间的差异大小,也可以说是相似性。 我是在图像处理中用到的,项目中需要计算图像梯度方向,我选择了四个方向,这样就可以用二位二进制表示,分别为 0,1,2,3,也就是 00,01,10,11,…

汉明距离、汉明损失详解及代码(python)

文章目录 引言汉明距离(Hamming distance)代码示例 汉明损失(Hamming loss)代码示例 参考链接 引言 汉明距离是机器学习中的常用度量。本文整理了具体的图示代码&#xff0c;帮你形象化理解汉明距离(Hamming distance)、汉明损失(Hamming loss)。 汉明距离(Hamming distance)…

汉明距离的计算

汉明距离&#xff0c;作为一种衡量特征距离的计算方法&#xff0c;在很多场合都有应用&#xff0c;其主要思想是找到两个特征之间的差异大小&#xff0c;也可以说是相似性。 我是在图像处理中用到的&#xff0c;项目中需要计算图像梯度方向&#xff0c;我选择了四个方向&#…

汉明距离问题详解

https://leetcode.cn/problems/hamming-distance/solution/yi-ming-ju-chi-by-leetcode-solution-u1w7/ 前言 汉明距离广泛应用于多个领域。在编码理论中用于错误检测&#xff0c;在信息论中量化字符串之间的差异。 两个整数之间的汉明距离是对应位置上数字不同的位数。 根据…