如何理解正定矩阵和半正定矩阵

article/2025/9/20 3:01:56

乍看正定和半正定会被吓得虎躯一震,因为名字取得不知所以,所以老是很排斥去理解这个东西是干嘛用的,下面根据自己和结合别人的观点解释一下什么是正定矩阵(positive definite, PD)半正定矩阵(positive semi-definite, PSD)

定义

首先从定义开始对PD和PSD有一个初步的概念:

  • 正定矩阵(PD):

    给定一个大小为 \(n\times n\)实对称矩阵 \(A\) ,若对于任意长度为 \(n\) 的非零向量 \(X\),有 \(X^TAX>0\) 恒成立,则矩阵 \(A\) 是一个正定矩阵。

  • 半正定矩阵(PSD)

    给定一个大小为 \(n\times n\)实对称矩阵 \(A\) ,若对于任意长度为 \(n\) 的非零向量 \(X\),有 \(X^TAX≥0\) 恒成立,则矩阵 \(A\) 是一个半正定矩阵。

说人话来理解

光看定义其实肯定不能理解到底是个啥,以及为什么要这么定义。所以下面用说人话的方式来进行解释。

仔细看一下上面的定义可以看到两种矩阵的唯一区别就是正定要求是大于0,而半正定要求大于等于0。这个是不是很像二次函数\(y=ax^2\)

  • \(a>0\)时, \(y>0\)
  • \(a≥0\)时,\(y≥0\)

其实我们可以把\(y=X^TAX\)看作是\(y=ax^2\)的多维扩展表达式,我们所说的正定矩阵就是希望矩阵\(A\)能够起到\(a>0\)的效果,半正定就是希望有一个矩阵\(A\)能够起到像\(a≥0\)的效果。

这么说起来你可能还是不太能理解,没关系,我们进一步从向量相乘的角度来理解。

以正定矩阵为例,它需要满足\(X^TAX>0\),而且我们知道矩阵相乘(如\(AX\))的本质是将向量\(X\)按照矩阵\(A\)所指定的方式进行变换(你可以通过阅读理解矩阵等系列文章来对矩阵乘法产生更加深刻的理解)。

我们可以记\(M=AX\),那么对于正定矩阵有\(X^TAX=X^TM>0\),看到这有没有想起cos公式呢?如下:

\[cos(\theta)=\frac{a^Tb}{||a||\times ||b||}\]

下面的内容是一层一层推进的,所以可能有点绕,请耐心阅读并思考:

  • 所以正定矩阵是个什么意思呢?实际上就是说对于一个向量\(X\),我们希望 \(X\)在经过有一个矩阵\(A\)的变化后得到的新的向量\(M\)和它本身的夹角小于90度。

  • 而小于90度背后的含义是变换后的向量\(M\)是沿着原向量\(X\)的正方向进行缩放的(即 \(M\)投影回原向量时方向不变)。

  • 而上面这句话还可以从特征向量的角度进一步理解,在介绍之前我们回顾一下特征值和特征向量的概念:

首先一个矩阵\(A\)的特征向量\(x\)就是表示某个向量会沿着特征向量的方向进行变换(缩放),缩放比例由特征值\(\lambda\)决定。例如:

\[ A_{1}=\left[\begin{array}{cc}{0.5} & {0} \\ {0} & {2}\end{array}\right] \]
很简单地可以计算得到\(A\)的特征值分别是0.5和2,而它们对应的特征向量分别是\([1,0]^T\)\([0,1]^T\)。所以如果一个向量\(b\)左乘一个矩阵\(A\),其本质就是将向量\(b\)沿着\([1,0]^T\)\([0,1]^T\)方向分别放大0.5和2倍。我们假设\(b=[2,2]^T\),那么\(Ab\)最终得到的向量为\([1,4]^T\),结合下图看更加直观:

x95cpnhrlj.png

我们看上图,如果其中一个特征值小于0,比如\(\lambda_1<0\)那么最终得到的向量\(\overrightarrow{Ab}\)投射到\(\overrightarrow{b}\)方向的向量与\(\overrightarrow{b}\)反向。综上,要使得变换后的向量\(M\)与原向量\(x\)夹角小于90度,即映射回原来的向量时保持方向不变,那么就需要特征值大于0,所以这也是为什么正定矩阵的特征值都大于0.



MARSGGBO原创





2019-8-28



转载于:https://www.cnblogs.com/marsggbo/p/11461155.html


http://chatgpt.dhexx.cn/article/MqtmQOgI.shtml

相关文章

半正定Toeplitz矩阵的范德蒙德分解

半正定Toeplitz矩阵的范德蒙德分解 Toeplitz矩阵的定义&#xff1a;Matrices whose entries are constant along each diagonal are called Toeplitz matrices. 形如 T [ r 0 r 1 r 2 r 3 r − 1 r 0 r 1 r 2 r − 2 r − 1 r 0 r 1 r − 3 r − 2 r − 1 r 0 ] (1) \boldsym…

线性代数学习笔记8-4:正定矩阵、二次型的几何意义、配方法与消元法的联系、最小二乘法与半正定矩阵A^T A

正定矩阵Positive definite matrice 之前说过&#xff0c;正定矩阵是一类特殊的对称矩阵&#xff1a; 正定矩阵满足对称矩阵的特性&#xff08;特征值为实数并且拥有一套正交特征向量、正 / 负主元的数目等于正 / 负特征值的数目&#xff09;另外&#xff0c;正定矩阵还具有更…

正态分布中的半正定矩阵(协方差矩阵)

正态分布中的半正定矩阵&#xff08;协方差矩阵&#xff09; 1.什么是正定矩阵和半正定矩阵 我们学习半正定矩阵前&#xff0c;得先了解&#xff0c;正定矩阵与半正定矩阵的关系以及什么是正定矩阵。这里先学习什么是二次型。 首先给出二次型的定义 定义1:设P为数域&#xf…

什么是正定矩阵,什么是负定矩阵?判别方法

一、负定矩阵判别方法有&#xff1a; 1、 A 的特征值都小于0 2、A的k阶顺序主子式 * (-1)^k > 0 &#xff08;也就是偶数阶主子式为正&#xff0c;奇数阶主子式为负。 顺序主子式是行列式&#xff0c;第k阶顺序主子式就是矩阵的前k行和前k列组成的行列式&#xff0c; &#…

半正定矩阵理解

半正定与正定矩阵同意用半正定矩阵来事例&#xff1a; 首先半正定矩阵定义为: 其中X 是向量&#xff0c;M 是变换矩阵 我们换一个思路看这个问题&#xff0c;矩阵变换中&#xff0c; 代表对向量 X进行变换&#xff0c;我们假设变换后的向量为Y&#xff0c;记做YMX。于是半正…

正定矩阵及其系列性质

1. 正定矩阵的定义 广义定义&#xff1a;设M是n阶方阵&#xff0c;如果对任何非零向量z&#xff0c;都有&#xff0c;则称M为正定矩阵&#xff1b; 狭义定义&#xff1a;一个n阶的实对称矩阵M是正定的的条件是当且仅当对于所有的非零实系数向量z&#xff0c;都有。 2. 正定矩…

半正定矩阵 正定

矩阵A正定是指,对任意的X≠0恒有X^TAX&#xff1e;0 矩阵A半正定是指,对任意的X≠0恒有X^TAX≥0 X^T代表X的转置 对一般的矩阵来说&#xff0c;要把矩阵化成标准型才可以这样说。一个矩阵是正定的是指该矩阵对应的实 二次型f&#xff08;x1,x2,...,xn&#xff09;对任意的一组不…

「正定矩阵」和「半正定矩阵」

在众多的机器学习模型中&#xff0c;线性代数的身影无处不在&#xff0c;当然&#xff0c;我们也会时常碰到线性代数中的正定矩阵和半正定矩阵。例如&#xff0c;多元正态分布的协方差矩阵要求是半正定的。 ------------------------------------------ 1. 基本的定义 正定和半…

正定矩阵与半正定矩阵

作者&#xff1a;cwaar链接&#xff1a;https://www.zhihu.com/question/22098422/answer/35874276来源&#xff1a;知乎 首先半正定矩阵定义为: 其中 X 是向量&#xff0c;M 是变换矩阵。 我们换一个思路看这个问题&#xff0c;矩阵变换中&#xff0c; 代表对向量 X 进行变换…

证明:协方差矩阵是半正定矩阵

好多年没看过linear algebra…… 感谢百度知道网友“xtimz”提供的答案。 写成分量形式就是这样。 &#xff08;看不清楚的话&#xff0c;可以对着这张图点右键&#xff0c;然后在新地址中打开该图片&#xff0c;就可以放大了。或者直接保存到本地再放大查看也行。&#xff0…

【线性代数】理解正定矩阵和半正定矩阵

目录 1 前言2 定义3 从几何的角度理解4 参考文献 1 前言 内容为自己的学习总结&#xff0c;其中多有借鉴他人的地方&#xff0c;最后一并给出链接。 2 定义 在机器学习和谱图理论的学习中&#xff0c;总会用到正定矩阵半正定矩阵概念&#xff0c;了解它们的概念是十分必要的。…

矩阵的 正定与半正定

先不慌&#xff0c;我们要搞清楚正定与半正定先熟悉几个基本的概念 一&#xff1a;矩阵的基 最简单的理解就是&#xff1a;线性变换就是线性映射&#xff0c;矩阵只不过是线性映射的系数而已。所以&#xff0c;选定基底实际是选定坐标轴&#xff08;不一定正交&#xff09;。我…

正定矩阵、负定矩阵、半正定矩阵、半负定矩阵

正定矩阵、负定矩阵、半正定矩阵、半负定矩阵 载▼ 1.正定矩阵 一个 nn 的实 对称矩阵 M 是 正定 的&#xff0c; 当且仅当 对于所有的非零实系数 向量 z &#xff0c;都有 zTMz > 0 。其中 z T 表示 z 的 转置 。 2.负定矩阵 与正定矩阵相对应的&#xff0c;一个nn的埃尔…

正定矩阵和半正定矩阵

定义 正定和半正定这两个词的英文分别是positive definite和positive semi-definite&#xff0c;其中&#xff0c;definite是一个形容词&#xff0c;表示“明确的、确定的”等意思。 【定义1】给定一个大小为的实对称矩阵 &#xff0c;若对于任意长度为 的非零向量 &#x…

半正定矩阵和正定矩阵的一些理解和补充

文章目录 一&#xff1a;半正定矩阵二&#xff1a;正定矩阵3.直观理解正定、半正定矩阵 一&#xff1a;半正定矩阵 设A是实对称矩阵。如果对任意的实非零列向量x有xTAx≥0&#xff0c;就称A为半正定矩阵。 等价条件&#xff1a; 1. A是半正定的…

半正定矩阵

1.【定义】给定一个大小为 n n nx n n n的实对称矩阵A,若对于任意长度为 n n n的向量 x x x,有 x T A x ≥ 0 x^{T}Ax \geq 0 xTAx≥0恒成立&#xff0c;则矩阵A是一个半正定矩阵。 半正定矩阵包含正定矩阵&#xff08;正定矩阵是 x T A x > 0 x^{T}Ax > 0 xTAx>0&…

正定矩阵(Positive Definite Matrices)、半正定矩阵(Positive Semidefinite Matrices)

正定矩阵、半正定矩阵 1.正定矩阵、半正定矩阵1.1 正定矩阵1.1.1 判断正定矩阵 1.2 半正定矩阵1.2.1 判定半正定矩阵 1.3 椭圆 a x 2 2 b x y c y 2 1 ax^22bxycy^21 ax22bxycy211.3.1 与对称矩阵 S S S有关的椭圆1.3.2 与特征值矩阵 Λ \Lambda Λ有关的椭圆 1.4 重要应用…

正定矩阵与半正定矩阵定义与判别

1.正定矩阵和半正定矩阵 若所有特征值均大于零&#xff0c;则称为正定。 定义:A是n阶方阵&#xff0c;如果对任何非零向量x&#xff0c;都有>0,其中表示x的转置&#xff0c;就称A为正定矩阵。 性质: 正定矩阵的行列式恒为正&#xff1b;实对称矩阵AA正定当且仅当AA与单位…

C++求解汉明距离

目录 汉明距离介绍汉明距离应用解法1&#xff1a;Brian Kernighan算法解法2解法3 汉明距离介绍 leetcode 461 汉明距离&#xff0c;难度&#xff1a;简单 两个整数之间的 汉明距离 指的是这两个数字对应二进制位不同的位置的数目。 给你两个整数 x 和 y&#xff0c;计算并返…

计算快速汉明距离

汉明距离,作为一种衡量特征距离的计算方法,在很多场合都有应用,其主要思想是找到两个特征之间的差异大小,也可以说是相似性。 我是在图像处理中用到的,项目中需要计算图像梯度方向,我选择了四个方向,这样就可以用二位二进制表示,分别为 0,1,2,3,也就是 00,01,10,11,…