如何理解矩阵特征值

article/2025/9/21 16:32:11

(下面的回答只涉及实数范围)。

关于特征值、特征向量可以讲的确实很多,我这里希望可以给大家建立一个直观的印象。

先给一个简短的回答,如果把矩阵看作是运动,对于运动而言,最重要的当然就是运动的速度和方向,那么(我后面会说明一下限制条件):

  • 特征值就是运动的速度
  • 特征向量就是运动的方向

既然运动最重要的两方面都被描述了,特征值、特征向量自然可以称为运动(即矩阵)的特征。

注意,由于矩阵是数学概念,非常抽象,所以上面所谓的运动、运动的速度、运动的方向都是广义的,在现实不同的应用中有不同的指代。

下面是详细的回答,我会先从几何上简单讲解下特征值、特征向量的定义指的是什么,然后再来解释为什么特征值、特征向量会是运动的速度和方向。

1 几何意义

说明下,因为线性变换总是在各种基之间变来变去,所以我下面画图都会把作图所用的基和原点给画出来。

\vec{i_{}},\vec{j_{}} 下面有个 \vec{v_{}}

随便左乘一个矩阵A,图像看上去没有什么特殊的:

我调整下 \vec{v_{}} 的方向,图像看上去有点特殊了:

可以观察到,调整后的 \vec{v_{}}A\vec{v_{}} 在同一根直线上,只是 A\vec{v_{}} 的长度相对\vec{v_{}}的长度变长了。

此时,我们就称 \vec{v_{}}A 的特征向量,而 A\vec{v_{}} 的长度是 \vec{v_{}} 的长度的 \lambda 倍,\lambda 就是特征值。

从而,特征值与特征向量的定义式就是这样的:

其实之前的 A 不止一个特征向量,还有一个特征向量:

容易从 A\vec{v_{}} 相对于 \vec{v_{}} 是变长了还是缩短看出,这两个特征向量对应的特征\lambda值,一个大于1,一个小于1。

从特征向量和特征值的定义式还可以看出,特征向量所在直线上的向量都是特征向量:

你可以自己动手试试,可以改变 \vec{v_{}} 的位置,以及矩阵 A 的值(特征空间会随着矩阵改变而改变):

此处有互动内容, 点击此处前往操作。

其中有些值构成的矩阵没有画出特征空间,可能是因为它的特征值、特征向量是复数,也可能是不存在。

下面就要说下,特征值、特征向量与运动的关系

2 运动的速度与方向

2.1 从调色谈起

我有一管不知道颜色的颜料,而且这管颜料有点特殊,我不能直接挤出来看颜色,只能通过调色来观察:

为了分辨出它是什么颜色(记得它只能通过调色来辨别):

因为反复混合之后,这管颜料的特征就凸显了出来,所以我们判断,这管颜料应该是蓝色。

说这个干什么?矩阵也有类似的情况。

2.2 矩阵的混合

一般来说,矩阵我们可以看作某种运动,而二维向量可以看作平面上的一个点(或者说一个箭头)。对于点我们是可以观察的,但是运动我们是不能直接观察的。

就好像,跑步这个动作,我们不附加到具体的某个事物上是观察不到的,我们只能观察到:人跑步、猪跑步、老虎跑步、......,然后从中总结出跑步的特点。

就好像之前举的不能直接观察的颜料一样,要观察矩阵所代表的运动,需要把它附加到向量上才观察的出来:

似乎还看不出什么。但是如果我反复运用矩阵乘法的话:

就像之前颜料混合一样,反复运用矩阵乘法,矩阵所代表的运动的最明显的特征,即速度最大的方向,就由最大特征值对应的特征向量展现了出来。

至于别的特征值对应的是什么速度,我后面会解释,这里先跳过。

可以自己动手试试,我把 \lambda 值也标注出来了,可以关注下最大 \lambda 值对于运动的影响:

此处有互动内容, 点击此处前往操作。

顺便说下,对于复数的特征值、特征向量,在上面就没有画出特征空间,但可以观察到反复运用矩阵乘法的结果是围绕着原点在旋转。关于复数特征值和特征向量这里就不展开来说了。

2.3 烧一壶斐波那契的水

上面说的运动太抽象了,我来举一个具体点的例子:烧水。

比如说我想烧一壶水,水的温度按照斐波那契数列升高,即下一秒的温度 T_{t+1} 与当前温度T_{t} 以及上一秒的温度T_{t-1}的关系为:

T_{t+1}=T_{t}+T_{t-1}

要继续计算下去,我只需要 T_{t+1} 以及 T_{t} 就可以继续算下去。因此我可以写成下面的式子:

\begin{bmatrix}T_{t+1}\\T_{t}\end{bmatrix}=\begin{bmatrix}1&1\\1&0\end{bmatrix}\begin{bmatrix}T_{t}\\T_{t-1}\end{bmatrix}

因此烧水这个运动我们可以抽象为矩阵 A=\begin{bmatrix}1&1\\1&0\end{bmatrix} ,反复进行这个运动就可以烧开这壶水,根据斐波那契数列,让我们从 \begin{bmatrix}1\\1\end{bmatrix} 点开始(感兴趣的话,可以通过之前的互动调整下参数,可以得到下面的结果):

就可以看出,这壶水的温度会沿着A的特征值最大的特征向量方向飞快增长,我估计要不了多久,在理想的情况下,温度就会突破百万度、千万度、亿万度,然后地球说不定就爆炸了。我们就说这个矩阵不稳定。

所以说,不要烧斐波那契的水。

实际上历史也是这样,欧拉在研究刚体的运动时发现,有一个方向最为重要,后来拉格朗日发现,哦,原来就是特征向量的方向。

我们知道特征值、特征向量有什么特点之后,下一步就想知道,为什么会这样?

3 特征值分解

下面讲解要用到矩阵乘法和相似矩阵的知识,我就不啰嗦了,可以参看我的回答: 行列式的本质是什么? 以及 相似矩阵是什么?

我们知道,对于矩阵A可以对角化的话,可以通过相似矩阵进行下面这样的特征值分解:

A=P\Lambda P^{-1}

其中\Lambda为对角阵,P的列向量是单位化的特征向量。

说的有点抽象,我们拿个具体的例子来讲:

对于方阵而言,矩阵不会进行维度的升降,所以矩阵代表的运动实际上只有两种:

  • 旋转
  • 拉伸

最后的运动结果就是这两种的合成。

我们再回头看下刚才的特征值分解,实际上把运动给分解开了:

我们来看看在几何上的表现是什么,因此相似矩阵的讲解涉及到基的变换,所以大家注意观察基:

左乘 P=\begin{bmatrix}\frac{-\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\end{bmatrix}

如果旋转前的基不正交,旋转之后变为了标准基,那么实际会产生伸缩,所以之前说的正交很重要。

继续左乘对角矩阵 \Lambda=\begin{bmatrix}3&0\\0&1\end{bmatrix}

相当于,之前的旋转是指明了拉伸的方向,所以我们理解了:

  • 特征值就是拉伸的大小
  • 特征向量指明了拉伸的方向

回到我们之前说的运动上去,特征值就是运动的速度,特征向量就是运动的方向,而其余方向的运动就由特征向量方向的运动合成。所以最大的特征值对应的特征向量指明了运动速度的最大方向。

但是,重申一下,上面的推论有一个重要的条件,特征向量正交,这样变换后才能保证变换最大的方向在基方向。如果特征向量不正交就有可能不是变化最大的方向,比如:

所以我们在实际应用中,都要去找正交基。但是特征向量很可能不是正交的,那么我们就需要奇异值分解了,这里就不展开了。

大家可以再回头去操作一下之前的动图,看看不正交的情况下有什么不一样。

左乘 P^{-1}=\begin{bmatrix}-\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\\\frac{\sqrt{2}}{2}&\frac{\sqrt{2}}{2}\end{bmatrix}

说明下,如果大家把这个文章和之前提到的我写的“相似矩阵”的文章参照来看的话,“相似矩阵”那篇文章里面我把图像的坐标系换了,所以看着图像没有变换(就好像直角坐标系到极坐标系下,图像是不会变换的)。而这里我把图像的坐标系给旋转、拉伸了,所以看着图像变换了(就好像换元,会导致图像变换)。这其实是看待矩阵乘法的两种视角,是等价的,但是显示到图像上就有所不同。

4 特征值、特征向量的应用

4.1 控制系统

之前的烧水系统是不稳定的。

\lambda = 1 的,系统最终会趋于稳定:

4.2 图片压缩

比如说,有下面这么一副512\times512的图片(方阵才有特征值,所以找了张正方形的图):

这个图片可以放到一个矩阵里面去,就是把每个像素的颜色值填入到一个512\times512A 矩阵中。

根据之前描述的有:

A=P\Lambda P^{-1}

其中,\Lambda 是对角阵,对角线上是从大到小排列的特征值。

我们在A=P\Lambda P^{-1}中只保留前面50个的特征值(也就是最大的50个,其实也只占了所有特征值的百分之十),其它的都填0,重新计算矩阵后,恢复为下面这样的图像:

效果还可以,其实一两百个特征值之和可能就占了所有特征值和的百分之九十了,其他的特征值都可以丢弃了。


http://chatgpt.dhexx.cn/article/lftNume3.shtml

相关文章

矩阵特征值的求解例子

请点击上面公众号,免费订阅。  《实例》阐述算法,通俗易懂,助您对算法的理解达到一个新高度。包含但不限于:经典算法,机器学习,深度学习,LeetCode 题解,Kaggle 实战。期待您的到来&…

矩阵和特征值的本质

理解矩阵和特征向量的本质 原文地址 最近复习矩阵论中,又是一堆定理和证明突然发现学了这么常时间的矩阵论、线性代数,记住的只是一堆莫名其妙的定理而已,一些本质的东西都没有搞清楚。 比如,为什么要有矩阵,它仅仅是…

MATLAB矩阵的特征值与特征向量

1.矩阵特征值的数学定义 设A是n阶方阵,如果存在常数λ和n维非零列向量x,使得等式Ax λx 成立,则称λ为A的特征值,x是对应特征值λ的特征向量。 2.求矩阵的特征值与特征向量 在MATLAB中,计算矩阵的特征值与特征向量的…

线性代数教程 矩阵的特征值

CSDN 的文档显示有一些问题,一些数学符号显示不正确,想看 word文档 的可以移步到 github : LearningDocuments/学习资料/平台无关/线性代数 at master IceEmblem/LearningDocuments GitHub 矩阵的特征值与特征向量 特征值与特征向量 对于…

矩阵的特征值与特征向量 求解

矩阵特征值 定义1:设A是n阶矩阵,如果数和n维非零列向量使关系式成立,则称这样的数成为方阵A的特征值,非零向量成为A对应于特征值的特征向量。 说明:1、特征向量,特征值问题是对方阵而言的。 2、n阶方阵A的…

矩阵的特征值及特征向量理解

直观印象 如果把矩阵看作是运动,对于运动而言,最重要的是运动的速度和方向,那么: 特征值就是运动的速度特征向量就是运动的方向 既然运动最重要的两方面都被描述了,特征值、特征向量自然可以称为运动(矩…

【矩阵计算】特征值计算

一、理论基础 1、Schur分解 如果复矩阵𝐴∈𝐶^(𝑛𝑛),那么存在一个酉矩阵Q∈𝐶^(𝑛𝑛),使得 Q^H AQTDN 这里Ddiag(μ1,⋯,μ𝑛),𝑁∈𝐶^(&am…

矩阵的特征值分解

特征值分解 物理意义: 矩阵可以表示一种变换;特征向量表示矩阵变换的方向;特征值表示矩阵变换在对应特征向量方向上的变换速度; 特征值与特征向量 如下一个二维向量,这个二维空间的基向量是; 将向量左乘一个矩阵A&…

手把手教你一整套R语言数据分析+建模流程

手把手教你一整套R语言数据分析建模流程 Intro项目背景前期准备数据描述数据清洗预分析及预处理数值型数据类别型数据 特征建模模型对比 Intro 近期在整理数据分析流程,找到了之前写的一篇代码,分享给大家。这是我上学时候做的一个项目,当时…

pca 主成分分析_通过主成分分析(PCA)了解您的数据并发现潜在模式

pca 主成分分析 Save time, resources and stay healthy with data exploration that goes beyond means, distributions and correlations: Leverage PCA to see through the surface of variables. It saves time and resources, because it uncovers data issues before an …

R中的主成分和因子分析

2019独角兽企业重金招聘Python工程师标准>>> 主成分分析(PCA) a、一种降维技巧,将大量相关变量转化为一组很少的相关变量,这些 无关变量称为主成分 b、用一组较少的不相关变量代替大量相关变量,同时尽可能保留初始变量的信息&…

时间序列预测法

转 时间序列预测法 一种历史资料延伸预测,也称历史引伸预测法。是以时间数列所能反映的社会经济现象的发展过程和规律性,进行引伸外推,预测其发展趋势的方法。 时间序列,也叫时间数列、历史复数或动态数列。它是将某种统计指标的…

甲基化系列 3. 甲基化芯片数据分析完整版(ChAMP)

点击关注,桓峰基因 桓峰基因 生物信息分析,SCI文章撰写及生物信息基础知识学习:R语言学习,perl基础编程,linux系统命令,Python遇见更好的你 104篇原创内容 公众号 桓峰基因的教程不但教您怎么使用&…

R 语言之数据分析高级方法「主成分分析」和「因子分析」

‍‍‍‍‍‍‍‍‍ 作者:姚某某 博客:https://zhuanlan.zhihu.com/mydata 往期回顾: R语言之数据分析高级方法「时间序列」 R语言之高级数据分析「聚类分析」 本节主要总结「数据分析」的「主成分分析」和「因子分析」的思想。 通过学习《 R…

转:Android 中Makefile的详细分析

http://blog.chinaunix.net/uid-25838286-id-3204120.html 随着移动互联网的发展,移动开发也越来越吃香了,目前最火的莫过于android,android是什么就不用说了,android自从开源以来,就受到很多人的追捧。当然&#xff0…

Python数据分析理论与实战完整版本

Python数据分析基础 一、Python数据分析初探二、数据获取2.1 数据获取的手段2.2 数据仓库2.3 检测与抓取2.4 填写、埋点、日志2.5 计算2.6 数据学习网站 三、单因子探索分析与可视化3.1 理论铺垫3.2 数据分类3.3 单属性分析3.4 单因子分析实战3.5 可视化小节 四、多因子探索分析…

223.主成分分析PCA

主成分分析 PCA 本节作者:刘华,中国科学技术大学 版本1.0.3,更新日期:2020年6月18日 什么是PCA(Principal Component Analysis) 相关背景 在许多领域的研究与应用中,通常需要对含有多个变量的数据进行观测,…

探索性数据分析EDA(二)—— 缺失值处理

接上一篇 《探索性数据分析(1)—— 变量识别和分析》, 这篇笔记主要内容为缺失值处理方法介绍,以及相关python工具包sklearn.impute的使用介绍。 目录 1. 为什么需要处理缺失值2. 为什么数据有缺失值a) 完全随机缺失(…

数据分析汇总

一、本文说明: 本文为自己学习的笔记,用来记录数分的相关知识,方便记录查阅。 二、指标体系建设与数据分析: 1、指标体系概念: ①:什么是指标体系: 企业指标的集合 ②:好…

5whys分析法在美团工程师中的实践

2019独角兽企业重金招聘Python工程师标准>>> 前言 网站的质量和稳定性对于用户和公司来说至关重要,但是在网站的快速发展过程中,由于各种原因导致事故不可避免的发生,这些大大小小的事故对公司难免会造成一些负面的影响&#xff0…