【线性代数】矩阵及其特性

article/2025/8/23 7:53:41

【线性代数】矩阵及其特性

    • 写在前面
    • 只拉伸不旋转的方向
      • 特征值和特征向量
      • 相似和对角化
      • 正交,对称矩阵
    • 拉伸最大的方向
    • 二次型理论
      • 从曲线而来
      • 合同矩阵
      • 正定二次型
    • 参考资料

写在前面

本文是笔者用于复习本科期间所学线性代数,试图用一种更易接受的方式加强记忆。

只拉伸不旋转的方向

特征值和特征向量

矩阵所代表的线性变化可以分为以下两种:旋转和拉伸。
而特征向量的就是【经过变化后只发生了拉伸的方向】。特征值是拉伸的程度。所以第一个基础公式为 A x = λ x Ax = \lambda x Ax=λx,根据这个公式可以得到特征值的求法, ( A − λ E ) x = 0 (A-\lambda E)x = 0 (AλE)x=0, 要使其有非0解,必须满足 ∣ A − λ E ∣ = 0 | A-\lambda E|=0 AλE=0 ,后文称之为【特征方程】。

下面讨论特征值和特征向量的性质,并给出简单的文字证明。

  • n阶方阵在复数域内有n个特征值,重根按照重数计算:特征方程为n次方程,n次方程在负数域有n个根。
  • 特征值之和等于A的对角线元素之和,也就是A的迹;特征值之积等于A的行列式的值:特征方程展开后根与系数的关系。
  • 互不相等的特征值对应的特征向量线性无关:使用反证法可证,有一种通俗的解释是,矩阵所表示的变化是线性的,也就是在同一个方向,特征值,也就是伸缩系数,必须是一个固定的值,那么不同的特征值对应的一定就是不同的方向啦。
  • 相同特征值对应的特征向量可能无关。

相似和对角化

相似的来源是【基坐标的转化】,其中A和D代表的是同一种变化。故而相似矩阵有相同的特征向量和特征值。相似被定义为 D = T − 1 A T D = T^{-1}AT D=T1AT 。此时D和A相似。

在这里插入图片描述

对角化就是从相似中演变出的一个概念,因为【对角化后的】矩阵有特别好的性质,我们在这个对角矩阵上,可以直接看作不同维度上的拉伸,而不用旋转,尤其是在幂的计算上格外方便。那么,什么样的矩阵可以对角化呢?

答案是【有n个线性无关的特征向量】的n阶矩阵。

  • 必要性:有n个线性无关的特征向量的矩阵可以对角化比较好理解,因为 A T = Λ T AT =ΛT AT=ΛT , T是由线性无关的特征向量所组成的,Λ是由对应的特征值组成的对角矩阵。
  • 充分性:A可以被相似对角化,也就是存在T,使得 T − 1 A T = Λ T^{-1}AT =Λ T1AT=Λ,其中Λ是对角矩阵。而T可逆,也就说明T中的向量不相关,我们可以拿这组不相关的向量作为A的特征值,Λ中的值作为特征值,其满足特征向量和特征值的定义。

根据n阶矩阵有n个特征值,如果把上面那句话换个说法,可以是【所有的特征向量都线性无关】,我们已经知道,不同特征值的特征向量一定线性无关,那么条件就变成【k重特征值有k个线性无关的特征向量】,所以我们这里引入了两个概念,来描述这两个数值。

  • 代数重数:k重特征值的代数重数为k。
  • 几何重数:这个特征值对应的特征子空间的维数,也就是其特征方程对应的解空间的维数,解向量的个数,这几个说法是等同的。

而它们的关系是:针对某个特定的特征值,【代数重数 ≥ \geq 几何重数】。显而易见,如果有超过代数重数的无关的特征向量,那n维矩阵对应超过n个特征向量,对于特征方程而言显然是不合理的。

于是,一个矩阵可以相似对角化的另一个充要条件是:【每一个特征值的几何重数都等于它的代数重数】。

正交,对称矩阵

正交的定义其实是由勾股定理推导而来,此处我们不深究,直接使用 a ⋅ b = 0 a · b = 0 ab=0 这种浅显的定义。
根据上面的相似,可以知道,一个变换可以在不同的视角来看,也就是不同的基向量。那么如果用一组【规范的】,【相互正交的】基来表示这个矩阵,任一向量的坐标就可以通过简单的投影确定了。下面我们先定义【正交矩阵】。

正交矩阵:由一组规范正交基 α 1 , α 2 . . . α n \alpha_1, \alpha_2...\alpha_n α1,α2...αn 组成的矩阵,满足 α i ⋅ α j = 0 \alpha_i · \alpha_j = 0 αiαj=0 α i ⋅ α i = 1 \alpha_i · \alpha_i = 1 αiαi=1

  • A , A ′ = A − 1 A,A'=A^{-1} AA=A1 都是正交矩阵,且满足 A A ′ = E AA' = E AA=E
  • ∣ A ∣ = 1 |A|=1 A=1 ∣ A ∣ = − 1 |A|=-1 A=1

【施密特正交化】可以将任意一组线性无关的基转化为规范正交基,也就是总有一组n个相互正交的基,可以表示n维空间。参考资料1中给出了很详细的推导过程和动画,这里只放一个图。每次确定一个基向量,向当前所有基向量投影,和就是新形成的直角三角形中的一条边。此时矩阵被正交化。再除以各自的模,得到的就是规范化后的正交矩阵。
请添加图片描述
讨论一个问题,经过施密特正交化后得到的向量还是原矩阵的特征向量吗?
答案是:需要满足【不同特征向量正交】或【对应同一特征值】。第一种情况无须规范化。第二种情况是我们通常使用施密特正交化的时候,此时,因为施密特正交化出的基和原基是同一个子空间的,所以仍然满足特征向量的公式。而如果把不同特征值的特征向量混在一起正交化,其对应的特征方程不同,无法进行线性的相加减,就无法保证其仍是特征向量。

下面讨论一种特殊的矩阵,【实对称矩阵】,这部分的证明比较复杂,仅给出对实对称矩阵的一种理解,就是所有的旋转都是“相对”的,比如维度1向维度3倾斜了k,那维度3一定也向维度1倾斜了k。

  • 实对称矩阵的特征值都是实数,且主元和特征值符号一致。
  • 实对称矩阵对应于不同特征值的特征向量必正交
  • 所有【特征根的几何重数==代数重数】,即一定可以相似对角化。
  • 对应于不同特征值的特征向量必正交,对应于相同特征值的特征向量必可以经过施密特正交化成另一组正交的特征向量。进一步,其相似【变换矩阵是一个正交矩阵】。

有一点比较奇怪的是,实对称矩阵并不能保证全部满秩,为什么还能对角化?此时,不满秩的部分特征值可以是0,这样对角化后不改变秩,所以不一定满秩。换言之,【实对称矩阵的秩等于非0特征值的个数】。n阶实对称矩阵无法保证有n个不同特征值,但一定可以保证有n个无关特征信息。

特征值体现了矩阵内禀的性质,有着广泛的应用:薛定谔方程中它对应能量,马尔可夫均衡态计算的关键,微分方程中相图的边界,谱聚类中所谓的谱即特征值…

拉伸最大的方向

上面提到,只有【有n个线性无关的特征向量】的n阶矩阵才能进行特征值分解,此处将该概念推广至一般矩阵。

下面引入【奇异值分解】的概念。不是所有的矩阵都能对角化(对称矩阵总是可以),而所有矩阵总是可以做奇异值分解的。同时,特征向量仅仅是代表了反向不变的地方,除非正交,否则“特征向量不变的方向并不保证是拉伸效果最大的方向,而这是奇异向量的方向。”
在这里插入图片描述

这个理论有很多应用,譬如一堆数据中,经过协方差矩阵的计算,奇异值最大的方向代表的是就方差最大的,也就是实际应用中变化最剧烈的。下面讨论背后的数学原理。先通过乘以自身的转置得到对称矩阵,然后特征值分解,得到两边的不同矩阵。
在这里插入图片描述
理解了正交矩阵的本质是仅旋转不拉伸,对角矩阵的本质是仅拉伸不旋转,下面这个图可以很好的展现如何把一个复杂的变换分为“旋转-拉伸-旋转”三步。
请添加图片描述
在这里插入图片描述
单独将奇异值分解区别于特征值分解,是因为该部分内容常常不在线性代数的基础内容中,而是作为特征值分解的一种扩展和应用。无论是特征值分解,还是奇异值分解,只要我们【保证了特征向量正交】,此时就保证了最开始的基是互相正交的,也就可以【保证特征值最大的方向就是拉伸最大的方向】。图中v1,v2只是代表了被施加变换两个任意的向量,而非基。

二次型理论

从曲线而来

在几何学中,椭圆双曲线等图形有着类似但不同的结构,于是对二次曲线和二次曲面的分类问题的讨论引起了二次型这个概念。它们有着类似的性质,也有着不同。【二次型】的规范定义是n个变量上的【二次】【齐次】多项式,因为一次项并不影响形状,只影响位置,所以不参与讨论。

此时, f ( x 1 1 , x 2 , . . . x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i x j f(x1_1, x_2, ...x_n) = \sum^n _{i=1} \sum^n_{j=1} a_{ij}x_ix_j f(x11,x2,...xn)=i=1nj=1naijxixj 可以被表示成矩阵形式。注意,这里我们将故意取 a i j = a j i = 1 / 2 x i x j 前 的 系 数 a{ij} = a{ji} = 1/2x_ix_j前的系数 aij=aji=1/2xixj,来保证矩阵的对称性,以获得更好的性质。【对称矩阵和二次型一一对应】。

现在,我们知道了二次齐次多项式代表的是曲线(面),但更喜欢统一形式的二次型:

  • 标准型】只含平方项的二次型。此时,矩阵为对角矩阵。随着基坐标的伸缩,前面的系数是可变的,也就是,标准型不唯一。
  • 规范性】系数只有1,-1和0的标准型。规范性唯一。

合同矩阵

上文的相似是用于描述相同变换在不同基下的表示,而合同是类似定义的一种关系,用于描述【相同的二次型图形在不同基下的表示】,所以人们想要通过基变换来统一二次型的形式,下面展示公式的推导过程。

  1. 选定两组基,矩阵 C 是两个基之间的过渡矩阵,设 x,y 是图形上同一个点在两个参考系中的坐标表示,则有 x = C y x=Cy x=Cy,这里必须满足【C可逆】才能保证这两组基都是满秩,也就是【过渡矩阵一定是可逆】的线性变换。

  2. 于是有 x T A x = ( C y ) T B ( C y ) = y T C T B C y x^TAx=(Cy)^TB(Cy)=y^TC^TBCy xTAx=(Cy)TB(Cy)=yTCTBCy,所以 A = C T B C A=C^TBC A=CTBC 就是描述这两个矩阵之间的关系等式,也就是合同。

会发现,A是对称矩阵,根据相似性知道存在正交矩阵C使得 C − 1 A C = C T A C = Λ C^{-1}AC = C^TAC = Λ C1AC=CTAC=Λ。说明【任一实对称矩阵都与对角矩阵合同】。换句话说,合同矩阵的出现,就是帮助我们来更方便的化简矩阵为标准型或规范型。

下面讨论合同矩阵的充要条件:【有相同正负惯性指数】,这里的惯性指数就是二次型的系数为正/负的个数。现在所有的实对称矩阵已经可以与一个对角阵合同了,那我们对这个对角阵施加以下变换:
在这里插入图片描述
用这个方式构造矩阵,所有的对角阵都会合同于一个由 ±1 以及 0 组成的对角阵,而正负取决于对角阵中特征值的正负。所以合同矩阵可以无限传递下去,反之拥有相同正负惯性指数的矩阵也可以无限变换成相同的规范型。这个定理的几何意义就是【标准型系数的正负取决了当前二次曲线(面)的形状】,而形状不会随着坐标系的变换而变换,椭圆仍是椭圆,双曲线仍是双曲线,改变的是描述这个形状的基向量!

回顾一下【矩阵的三种关系】,限制条件依次从强到弱:相似时,秩、特征值不变 == 合同时,秩、惯性指数不变 > 等价时,秩不变。其中对于实对称矩阵而言,相似 > 合同 > 等价。

正定二次型

正定二次型这个概念非常好理解,给出其等价形式:n 阶实对称矩阵 A 正定 ⇔ A 的正惯性指数等于 n ⇔ A 与单位阵合同 ⇔ A 的特征值全部大于 0 ⇔ A 的顺序主子式大于 0

实际上二次型可以划分成正定,负定,半正定等等,就是解决了最初的曲面分类问题。同时,这些矩阵被广泛应用于其它领域,比如微分方程的极值判断,最小二乘法等。

参考资料

  • 如何理解施密特(Schmidt)正交化
  • 如何理解几何重数与代数重数
  • 刘梳子数学——MIT线性代数笔记
  • 3blue1brown【官方双语/合集】线性代数的本质 - 系列合集
  • 线性代数与空间解析几何(第四版)
  • 施密特正交化后得到的向量还是原矩阵的特征向量吗
  • 对称矩阵及正定性
  • 二次型和矩阵合同

http://chatgpt.dhexx.cn/article/ShImqVyD.shtml

相关文章

对称函数、半正定矩阵(核函数涉及)

一、对称函数 在对称函数中,函数的输出值不随输入变数的排列而改变。从函数的形式中可以看出若输入变数排列后,方程式不会改变。例如对于一个球体.若 φ 为其方位角,θ为其天顶角,r为半径,则大圆距离可以表…

矩阵的秩,特征值和特征向量 矩阵基础概念

矩阵是非常重要而基础的数学知识了。大学课上学线性代数基本就是在学矩阵的各种操作和运算。在深度学习里,几乎所有的参数也都是存放在矩阵中,并通过矩阵来做各种运算。大概把矩阵的基本知识点复习和总结一下。 行列式和矩阵的区别: 行列式和…

c++求矩阵的秩_常见的矩阵分解

矩阵的谱分解(可对角化矩阵——满秩可逆) 谱分解定理:设 为一个n阶可对角化矩阵,A的谱为 其中 的重数为 ,则存在唯一一组s个n阶方阵 ,满足(1) (2) (3) (4) (5) 这些矩阵 称为矩阵A的成分矩阵或主幂等矩阵。一般成分矩阵不一定是Hermite矩阵&a…

线性代数笔记15——矩阵空间和秩1矩阵

矩阵空间 矩阵空间是对向量空间的扩展,因为矩阵的本质是向量,所以与向量空间类似,也存在矩阵空间。 在向量空间中,任意两个向量的加法和数乘仍然在该空间内。类似的,所有固定大小的矩阵也组成了矩阵空间,在…

满秩矩阵与正定矩阵

满秩矩阵 设A是n阶矩阵, 若r(A) n, 则称A为满秩矩阵。但满秩不局限于n阶矩阵。 若矩阵秩等于行数,称为行满秩;若矩阵秩等于列数,称为列满秩。既是行满秩又是列满秩则为n阶矩阵即n阶方阵。 矩阵的秩: 用初…

矩阵转置与矩阵对称性的关系

对称矩阵的定义:对称矩阵是指以主对角线为对称轴,各元素对应相等的矩阵 即的方阵 用两种方式说明矩阵的转置与矩阵自身相乘的结果是一个对称矩阵(S为对称矩阵) 方法一: 假设有3 x 2的矩阵 根据矩阵乘法可知&#xf…

线性代数学习之对称矩阵与矩阵的SVD分解

完美的对称矩阵: 定义: 在上一次线性代数学习之特征值与特征向量 - cexo - 博客园学习了矩阵的特征值和特征向量相关的概念,这次则继续延展上一次的内容,这次则来学习对称矩阵,其标题上加了“完美”俩字,…

实对称矩阵的特征值求法_线性代数之实对称矩阵得相似对角化问题的方法总结...

对于一个实对称矩阵不仅可以通过一个可逆矩阵相似对角化,还可以通过一个正交矩阵来相似对角化。实对称矩阵的不同特征值所对应的特征向量正交,而且实对称矩阵的特征值全为实数。在考研中,我们一定要重点掌握会求一个正交矩阵来相似对角化,这里的正交矩阵是矩阵的彼此正交且…

三阶实对称矩阵的秩一分解(快速计算三阶矩阵特征值特征向量的方法)

定理:三阶实对称矩阵如果存在二重特征根一定可以写成如下形式 其中三个特征值为,,,其中一个特征向量是。根据定义,另一特征向量一定是与和正交的向量。 通过上述方法,可以快速计算出三个特征值和一个特征向…

为什么非零实对称矩阵一定是正定矩阵

从酉相似的角度证明实对称矩阵一定可以对角化,对角化之后对应的二次型一定大于0,因此实对称矩阵一定是正定矩阵。 第一张图说明了一个方阵A必定酉相似于一个上三角矩阵T,T的对角线元素就是A的特征值。且这里可以无论特征值重复与否。 第二张…

矩阵求秩

矩阵的秩怎么计算,这个问题一下子我居然不知道怎么下手。。虽然本科的时候学过线性代数,但是好久不用,很多东西都忘了。。今天略微梳理一下吧。 最简单直观的方法: 化成行最简形(或行阶梯形),然…

搜片源必备

1.入门级 一般的经典、大众类电影,在各大主流视频网站都有。如:腾讯、优酷、爱奇艺、搜狐、乐视等。 2.初级 冷门的、最新的电影,以及一些“非主流”电影,可以通过网盘搜索引擎和一些影视资源网站来获取。 个人推荐的网盘引擎 呆…

各种搜索

搜索 本校的Lazer2001 学长为我们讲了搜索(乱搞) 搜索 基础:位运算 超级基础感觉有点难度?bitset例题:位运算 & bitset 基础搜索 DFSBFS 特殊的搜索方式 双向DFS搜索双向BFS搜索哈希康托展开迭代加深搜索&#xff…

搜索APP

文章目录 目录 文章目录 概要 功能模块图 技术名词解释 架构设计 小结 概要 本项目系统整体实现了登录功能、注册功能,首页页面的搜索功能、首页内容,我的界面中个人信息的增删改查、浏览记录、退出登录功能。 在App中用到Activity、Service组件…

搜索大全。

蓝桥杯搜索大全 练功(bfs,相同步数的节点在队列中该以如何顺序摆放机器人塔(最底行定则全局定,如熄灯问题)卡片换位存储信息一维坐标和二维坐标的转化 迷宫与陷阱 练功(bfs,相同步数的节点在队列中该以如何顺序摆放 最…

安装SQL Server2012

一、软件介绍 Microsoft SQL Server 是一个全面的数据库平台,使用集成的商业智能 (BI)工具提供了企业级的数据管理。Microsoft SQL Server 数据库引擎为关系型数据和结构化数据提供了更安全可靠的存储功能,使您可以构建和管理用于业务的高可用和高性能的…

SQL server2012 安装

SQL server2012 安装教程 (简体中文版的安装) 首先安装需要安装包吧:https://pan.baidu.com/s/1KoirFKEOv1363TXVWtE2Zg 密码:xsg1 下载后有一个ISO镜像文件,直接用解压软件解压就行,打开解压后的文件夹&…

SQL Server2012 安装方法详解

欢迎大家关注我的公众号,添加我为好友! 首先要找到自己下载好的安装包,并且保持网络畅通。 最近有不少细心的小伙伴反应安装包有问题,我这里进行了一下更新! 链接:https://pan.baidu.com/s/1bB-WS_zmHy_-…

sql2012下载,安装,

一、准备(下载)需要的文件 文件名:sql2012(x86).zip和sql2012(x64).iso,下面教程以前者为例,后者一样 百度云链接:度盘 单击出错?可以右击在新的标签页中打开 提取密码:734j 最新版&…

SQLServer2008密钥

2008-8-15最新修订版和Visual Studio 2008一样,从官网下载SQL Server 2008的180天试用版其实与正式版内容是基本相同的,唯一的区别就在于安装配置文件中所包含的key。各种版本的SQL Server在进行到这一步之前都是完全一样的: 如果你没有序列号…