向量与向量空间
这一篇文章是线性代数系列的第一篇,国内外一般的课程与教材都是从线性方程组开始讲线性代数,从高斯消元、高斯约旦这些方法入门线性代数也是对新手比较友好的。这个系列的文章可能会比国内的教材更接近线代的本质(博主自以为 ),所以对做题、套路之类的涉及不多,主要参考的是Meyer的《Matrix Analysis and Applied Linear Algebra》和Manolis的youtobe频道,还有3Blue1Brown的bilibili频道。
定义
先从定义讲起。
什么是向量
向量这个概念其实从高中就有接触。高中数学课本中,向量是直角坐标系中的有序二元数对 (x,y);物理课上,这东西又被叫做矢量,由长度和方向定义;上了大学之后,接触过计算机的同学可能也知道,向量是一个有序的列表,比如C语言的vector,一般可以与数组进行类比。需要注意的是:这里不论是列表还是数对,顺序都是重要的,变换顺序可能就不是原来的向量了。下面给出维基百科的定义:
一切具有大小和方向,并且满足四边形法则的集合对象都叫做向量。
而实际上在线性代数这门课里,向量一般指列向量,也就是多个数字的有序排列。
向量空间
Vector Space(向量空间) 是线代中极其重要的一个概念,真正理解起来十分抽象, 请看下面这句话
A vector space V over k is an abelian group V with operation + together with a ring homomorphism k → End(V) from k into the ring of
endomorphisms of V.
是不是一脸懵逼?没事,实际上博主也至今没有理解这个定义,其中涉及到很多抽象代数的定义,不常用的话很容易忘记,所以就不用为难自己去理解了。
课上会讲的定义一般长这样
再简单一点来记,对加法和数乘封闭的一般都是向量空间,比如二维空间、三维空间、多项式函数空间、矩阵的行列空间等等。
需要记住:
- 空间必须包含零点
- 空间内的元素必有无限个,除了空集(特例)
- 任意数量的向量,其线性组合都可以形成一个空间
- 子空间也是空间,需满足所有空间的定义
对空间的操作
两个子空间S1, S2 的交集仍然是子空间,然而并集不是,反例很容易给出,如二维空间中的 y=x 与 y=2x。
子空间的和
定义:
T h e s u m o f s u b s p a c e s S i , i ∈ { 1 , 2... l } i s t h e s e t o f a l l ∑ i ∈ [ l ] a i s i w h e r e a i ∈ R , s i ∈ S i , d e n o t e d b y ∑ i ∈ [ l ] S i . The\ sum\ of\ subspaces\ S_i, i\in\{1,2...l\}\ is\ the\ set\ of\ all\ \sum_{i\in [l]}a_is_i\ where\ a_i\in R,s_i\in S_i,\ denoted\ by\ \sum_{i\in [l]}S_i. The sum of subspaces Si,i∈{1,2...l} is the set of all i∈[l]∑aisi where ai∈R,si∈Si, denoted by i∈[l]∑Si.
任意两条不同直线的和构成一个二维平面,任意平面和与它不平行的直线构成一个三维空间。
基和维度
基是空间的另一个重要概念,基是空间中一组向量的集合,空间中任意元素都可以由基的线性组合构成,用数学语言表达,假设B是空间V的一组基 {x1, x2,…, xn},那么
∀ v ∈ V , ∃ k 1 , ⋯ , k n ∈ R : v = ∑ i = 1 n k i x i \forall v\in V,\ \exist k_1,\cdots, k_n\in R:\ v = \sum_{i=1}^{n}k_i\textbf{x}_i ∀v∈V, ∃k1,⋯,kn∈R: v=i=1∑nkixi
空间的基是最小生成集,同时也是最大线性独立集。也就是说,在空间 V 中,任何基数比 B 小的集合都无法生成 V 中所有元素,而任何基数比 B 大的集合都必然线性相关。基所包含的向量个数就是空间的维度,读者可以自行用二维和三维空间举例理解。
矩阵的秩
首先给出Meyer在书中的定义
Suppose a m×n matrix A is reduced by row operations to an echelon form E.
The rank of A is defined to be the number
r a n k ( A ) = # p i v o t s = # n o n z e r o r o w s i n E \begin{aligned} rank(A) &= \# pivots\\ &= \#\ nonzero\ rows\ in\ \textbf{E} \end{aligned} rank(A)=#pivots=# nonzero rows in E
学过线代的同学肯定对秩不陌生,这在各种证明题中往往是让人头疼的部分。
下面给出几个关于秩的定理
- r a n k ( A B ) = r a n k ( B ) − d i m N ( A ) ∩ R ( A ) rank(AB) = rank(B) - dimN(A)\cap R(A) rank(AB)=rank(B)−dimN(A)∩R(A)
- r a n k ( A T A ) = r a n k ( A A T ) = r a n k ( A ) rank(A^TA) = rank(AA^T) = rank(A) rank(ATA)=rank(AAT)=rank(A)
- r a n k ( A B ) ≤ m i n { r a n k ( A ) , r a n k ( B ) } rank(AB) \leq min\{ rank(A), rank(B) \} rank(AB)≤min{rank(A),rank(B)}
这之中最重要的是第一个定理,出自Meyer书中的 4.5.1,证明懒得写了,直接照搬书上的吧,看不明白的伙伴麻烦百度
四个基本子空间
矩阵的四个基本子空间:行空间、列空间、零空间、左零空间。前二者分别是矩阵行向量和列向量张成的空间,后二者是与矩阵相乘为0的向量的集合。下面的图很形象的解释了四个空间的联系,其中
- 行列空间的维度都等于矩阵的秩
- 行空间与零空间互补(这一概念会在后面的文章提到)。