向量范数和矩阵范数的理解

article/2025/9/18 16:40:26

向量范数

今天来聊一聊机器学习矩阵论的相关知识——范数(Norm)。

在学习机器学习基础算法的推导过程中,可以看到很多地方都应用到了这个范数。范数属于矩阵论的知识范围,可见数学基础的重要性。

机器学习的数学基础重点推荐——MIT的机器学习数学基础课

如果只需要快速了解,请参考——矩阵范数计算

完整的MIT数学基础课程笔记可以参考:MIT 18.06 线性代数笔记

这是个非常棒的手动演算流程,本文也将编码进行验算。

向量范数

定义:一个向量空间V到实数空间的映射,不仅如此,还要满足喜爱额条件:

  • ∣ ∣ x ∣ ∣ ⩾ 0 ||x||\geqslant 0 x0,并且 ∣ ∣ x ∣ ∣ = 0 → x = 0 ||x||=0 \rightarrow x=0 x=0x=0
  • 对于任意实数$\gamma , 有 ,有 ||\gamma x|| = \gamma ||x||$
  • 满足三角不等式, ∣ ∣ x ∣ ∣ + ∣ ∣ y ∣ ∣ ⩾ ∣ ∣ x + y ∣ ∣ ||x||+||y|| \geqslant ||x+y|| x+yx+y

1-norms

对于向量 V = [ v 1 , v 2 , v 3 , … , v n ] V=[v_1,v_2,v_3,\dots,v_n] V=[v1,v2,v3,,vn],他的范数是 ∣ ∣ v ∣ ∣ = ∣ v 1 ∣ + ∣ v 2 ∣ + ∣ v 3 ∣ + ⋯ + ∣ v n ∣ = ∑ i = 1 n ∣ v i ∣ ||v||=|v_1|+|v_2|+|v_3|+\dots+|v_n|=\sum_{i=1}^{n}|v_i| v=v1+v2+v3++vn=i=1nvi

2-norms(欧几里得范数)

∣ ∣ x ∣ ∣ 2 = v 1 2 + v 2 2 + ⋯ + v n 2 = ∑ i = 1 n v i 2 ||x||_2=\sqrt{v_1^2+v_2^2+\dots+v_n^2}=\sqrt{\sum_{i=1}^{n}v_i^2} x2=v12+v22++vn2 =i=1nvi2

p-norms(特别的 ∞ \infty -范数)

∣ ∣ x ∣ ∣ p = ( ∑ i = 1 n ∣ v i ∣ p ) 1 p , a n d p ⩾ 1 ||x||_p=(\sum_{i=1}^{n} |v_i|^p)^{\frac{1}{p} },and \quad p\geqslant 1 xp=(i=1nvip)p1andp1

∞ \infty -norms

∣ ∣ x ∣ ∣ ∞ = m a x 1 ⩽ j ⩽ n ∣ x j ∣ ||x||_\infty =max_{1 \leqslant j \leqslant n}|x_j| x=max1jnxj

可视化

还有来自于知乎的数值计算的图:

Credit to https://ncatlab.org/nlab/show/p-norm

n=2时,令 ∣ ∣ x ∣ p = 1 ||x|_p =1 xp=1,画出轮廓。p=1时候是菱形,p=2是圆形,p=6是圆角矩形,p=∞是方形。

对于渲染voronoi图或者机器学习的时候,使用不同范数将获得不同的边界。下图展示了离两个固定点距离相同的点组成的边界,范数定义不同,边界也不同。2-范数最简单,一直是垂直平分线,1-范数和∞-范数都存在折线,而且随着两固定点连线和x轴夹角的变化,会出现边界突变的情况。另外,这三个范数绘制的边界都经过2-范数定义的中点。有兴趣可以试下p>2时候的情况。——数值计算:向量和矩阵范数

From https://zhuanlan.zhihu.com/p/84185235

在我们的机器学习和神经网络最优化问题就经常会使用范数,MIT的老师就给我们举了一个例子:

假设我们要求 c 1 x 1 + c 2 x 2 = 0 c_1x_1+c_2x_2=0 c1x1+c2x2=0,限制条件下 x x x的最小范数:

其中的思想可以理解成,你以任何一种范数对应的图形,从原点开始blow up(增大),直到和限制条件出现交点(hit first),那么久最小的blow up,也就是上式所求最小化问题的答案。

矩阵范数

我觉得理解一样事物应该从感性的角度出发,推荐一个博文——范数的物理意义

其中精髓如下:

  1. 函数图象联系了函数和几何,表达两个数之间的变化关系,映射推广了函数的概念
  2. 为了便于研究映射的性质以及数学表达,我们首先需要对映射的对象进行“量化”,取定一组“基”;确定事物在这组基下的坐标,事物同构于我们所熟悉的抽象几何空间中的点,事物的映射可以理解为从一个空间中的点到另一个空间的点的映射,而映射本身也是事物;
  3. 从一个线性空间到另一个线性空间的线性映射,可以用一个矩阵来表达,矩阵被看线性作映射;
  4. 矩阵范数反映了线性映射把一个向量映射为另一个向量,向量的“长度”缩放的比例;
  5. 由矩阵算子范数的定义形式(下面小节的定义公式)可知,矩阵 A A A把向量 x x x映射成向量 A x Ax Ax,取其在向量 x x x范数为1所构成的闭集下的向量 A x Ax Ax范数最大值作为矩阵A的范数,即矩阵对向量缩放的比例的上界,矩阵的算子范数是相容的。
  6. 由几何意义可知,矩阵的算子范数必然大于等于矩阵谱半径(最大特征值的绝对值),矩阵算子范数对应一个取到向量 A x Ax Ax范数最大时的向量 x x x方向,谱半径对应最大特征值下的特征向量的方向
  7. 矩阵的奇异值分解SVD,分解成左右各一个酉阵,和拟对角矩阵,可以理解为对向量先作旋转、再缩放、最后再旋转,奇异值,就是缩放的比例,最大奇异值就是谱半径的推广,所以,矩阵算子范数大于等于矩阵的最大奇异值,酉阵在此算子范数的意义下,范数大于等于1。此外,不同的矩阵范数是等价的。

通过向量定义的矩阵范数

∣ ∣ A ∣ ∣ p = m a x x ≠ 0 ∣ ∣ A x ∣ ∣ p ∣ ∣ x ∣ ∣ p = m a x ∣ ∣ x ∣ ∣ p = 1 ∣ ∣ A x ∣ ∣ p = σ 1 ||A||_p =\ max_{x \neq 0} \frac{||Ax||_p}{||x||_p}= \ max_{||x||_p=1}||Ax||_p= \ \sigma_1 Ap= maxx=0xpAxp= maxxp=1Axp= σ1

这个 σ 1 \sigma_1 σ1是最大的奇异值,那么哪个是x?

如果x是个特征函数,那么他们的比例其实就是特征值 λ \lambda λ,所以他不是特征向量,而是奇异值向量 v 1 v_1 v1

矩阵 2-范数

矩阵2-范数: ∣ ∣ A ∣ ∣ 2 = λ m a x ( A 2 A ) ||A||_2 = \sqrt{\lambda_max(A^2A) } A2=λmax(A2A) ,为 A T A A^TA ATA的最大特征值,取其对应的特征向量 x x x ,有 A T A x = λ m a x ( A T A ) x = ∣ ∣ A ∣ ∣ 2 2 x A^TAx = \lambda_{max}(A^TA)x= \ ||A||^2_2x ATAx=λmax(ATA)x= A22x

所以, A T A x = ∣ ∣ A ∣ ∣ 2 2 x A^TAx =||A||^2_2x ATAx=A22x

∣ ∣ A ∣ ∣ 2 2 x ||A||_2^2x A22x取1-范数:
∣ ∣ ( ∣ ∣ A ∣ ∣ 2 2 x ) ∣ ∣ 1 = ∣ ∣ A T A x ∣ ∣ 1 ⩽ ∣ ∣ A T ∣ ∣ 1 ∣ ∣ A ∣ ∣ 1 ∣ ∣ x ∣ ∣ 1 = ∣ ∣ A ∣ ∣ ∞ ∣ ∣ A ∣ ∣ 1 ∣ ∣ x ∣ ∣ 1 ||\ (||A||^2_2x)||_1 \ = \ ||A^TAx||_1 \leqslant ||A^T||_1||A||_1||x||_1=\quad ||A||_\infty||A||_1||x||_1  (A22x)1 = ATAx1AT1A1x1=AA1x1

∣ ∣ ( ∣ ∣ A ∣ ∣ 2 2 x ) ∣ ∣ 1 = ∣ ∣ A ∣ ∣ 2 2 ∣ ∣ x ∣ ∣ 1 ⩽ ∣ ∣ A ∣ ∣ ∞ ∣ ∣ A ∣ ∣ 1 ∣ ∣ x ∣ ∣ 1 ||(||A||^2_2x)||_1 = ||A||_2^2||x||_1 \leqslant ||A||_\infty||A||_1||x||_1 (A22x)1=A22x1AA1x1

∣ ∣ A ∣ ∣ 2 2 ⩽ ∣ ∣ A ∣ ∣ ∞ ∣ ∣ A ∣ ∣ 1 ||A||_2^2 \leqslant||A||_{\infty}||A||_1 A22AA1

Frobenius范数

∣ ∣ A ∣ ∣ F = ( ∑ i ∑ j ∣ a i j ∣ 2 ) 1 2 ||A||_F= (\sum_{i} \sum_{j} |a_{ij}|^2)^{\frac{1}{2}} AF=(ijaij2)21

其中对 A A A进行SVD,得到 A = U Σ V T A=U \Sigma V^T A=UΣVT,可以看出 A A A的Forbenius范数,其实就是进行SVD的 Σ \Sigma Σ的范数。然后就产生了一个新的范数 ∣ ∣ A ∣ ∣ N ||A||_N AN:

∣ ∣ A ∣ ∣ N = σ 1 2 + σ 2 2 + ⋯ + σ n 2 ||A||_N = \sqrt{\sigma_1^2+\sigma_2^2+\dots+\sigma_n^2} AN=σ12+σ22++σn2

Practise:实践是检验真理的为唯一标准!

对于开头提到的博客,其中进行手算的矩阵norms,本文使用python的numpy进行计算,方便对于每一个计算中间过程进行检查和查看:

print("验证博客手算结果:https://blog.csdn.net/codinghappiness/article/details/90896632")
print("待求矩阵A为:")
A = np.matrix('-1,,5,-2;-2,1,0;3,-8,2')
print(A)print("矩阵A的1范数:")
print (np.linalg.norm(A,ord=1))print("矩阵A的2范数:")
print (np.linalg.norm(A,ord=2))print("以下是分步的计算过程进行验证:")
#print(A.T)
print("A转置A的结果是B:")
B = A.T.dot(A)
print(B)
print("求得特征值:")
e, v = np.linalg.eig(B)
print(e)
print("其中最大得为:")
print(e[0])
print("开平方:")
print(math.sqrt(e[0]))

http://chatgpt.dhexx.cn/article/jschSJeA.shtml

相关文章

【矩阵论】范数和矩阵函数(1)

范数及矩阵函数之范数的概念 首先将本章的内容做以下大致的梳理: 我们通过范数的概念来解决矩阵函数的问题,利用矩阵的函数可以解决很多实际问题。 一. 概念与定义 1. 范数与赋范线性空间 (1)范数——向量空间上的满足某些性质…

矩阵范数与矩阵的模

矩阵范数(matrix norm)是数学中矩阵论、线性代数、泛函分析等领域中常见的基本概念,是将一定的矩阵空间建立为赋范向量空间时为矩阵装备的范数。应用中常将有限维赋范向量空间之间的映射以矩阵的形式表现,这时映射空间上装备的范数…

【数学】向量范数和矩阵范数(几种范数 norm 的简单介绍)

目录&索引 一、什么是范式?二、向量范式1-范数2-范数P-范数∞-范数-∞-范数 三、矩阵范式1-范数2-范数∞-范数F-范数 四、小结 一、什么是范式? 范数,是具有“长度”概念的函数。在线性代数、泛函分析及相关的数学领域,范数是…

鬼畜视频制作必备——vegas pro特别版歌声合成工具UTAU

很好奇鬼畜是怎么做出来的?绝大部分up主用的必备的就是vegas,剪视频比较全能,比如:添加字幕、旋转视频、导入导出视频、导入导出视频等等,同时还提供了先进的悬停取消技术、高分辨率格式高达4K的音频素材以及支持4K UH…

平板电脑必装十大软件_知乎高赞回答:职场新人必装的电脑软件有哪些?太全了!...

本文首发于知乎,我觉得对大家很有帮助,因此同步了过来。 来源 :Tools指南知乎号 之前在微博上看到一篇文章,其中有一点让我很诧异:一个新入职的员工,不知道用什么软件打开rar压缩包。 但想到我刚入职场时,也是这个样子,马上就释然了。 但有一个新的问题出现了:刚入职场…

动态图册用HTML怎么制作,imgplay gif动图制作如何使用?imgplay图文使用教程

imgplay是一款利用图片、视频就能轻松制作GIF的应用软件。通过这款软件,大家可以切身感受拍照片和视频时的精彩瞬间,下面小编就为大家讲解imgplay软件的使用方法。 推荐下载: 软件名称:imgplay gif动图制作软件 3.0.1 官网安卓版软…

Filmigo视频剪辑VIP,这是一款多功能视频编辑、影片剪辑、图片美化、视频/音频制作 影音软件,功能强大!

《Filmigo视频剪辑》介绍:这是一款多功能视频编辑、影片剪辑、图片美化、视频/音频制作、配乐美颜影音软件,是一款简单易用的视频编辑、视频裁剪与视频剪辑工具,获得2018年google paly“娱乐奖项”应用APP;全球超过三千万视频剪辑…

视频编辑软件,哪款好?

过完了快快乐乐的圣诞节,拍了很多美美的照片,单独将照片一张一张放出来是不是显得太过于单调了,如果将美美的照片整合成一个美美的视频,那么是不是会吸粉更多呢?! 要制作出一部画面精良的视频,…

android系统视频剪辑app推荐,知乎10w人收藏:玩短视频必装的9款剪辑App(最全)...

声明:本文来自于微信公众号 微果酱(ID:wjam123456),作者: 橙子,授权站长之家转载发布。 做运营的 每天都要面临一些新难题 比如老板想追潮流做短视频 吐血写脚本、拍完视频 磨刀霍霍向猪羊准备剪视频 打开电脑剪辑软…

会声会影2022正式版一键式视频剪辑软件

多场景适用,会声会影2022适用于个人、商店或是企业,可满足vlog视频、影视混剪、游戏解说、电子相册制作、淘宝主图视频、企业宣传片、线上网课制作等需求!下载末尾会声会影教程参考! 基础剪辑,一应俱全 剪切 分割、删除、合并一气呵成&…

超全,短视频制作必备工具

都知道短视频是当下的热门领域,也有很多的普通人借助短视频平台走红,令人艳羡不已。那么,短视频到底怎么创作呢?下面就按照短视频的制作流程,给大家盘点一下超实用的那些工具: 01 选题——即时热榜 为什么…

手机音频拼接软件_自媒体视频,手机剪辑有哪些软件推荐?

做自媒体视频,很多人是用手机拍摄,手机剪辑,那么有哪些比较好用的手机剪辑软件呢? 剪映:一款全能免费抖音官方剪辑工具。 模板,比较多,更新快,在【灵感】里,进去之后随便…

android视频编辑功能,万能视频编辑器

万能视频编辑器app是一款专业免费的视频剪辑客户端应用,万能视频编辑器软件不仅有超全的剪辑所需工具,还有上百种视频特效,用户可以随时diy剪辑视频,万能视频编辑器支持多格式随意转化。 软件介绍 万能视频编辑器,一款…

三阶魔方玩法

参考:三级魔方还原公式_哔哩哔哩_bilibili

魔方还原的七步法

首先,破解魔方,我们就要先了解它的结构,魔方共6色6面,每面又分为中央块(最中间的块6个)、角块(4角的块8个)和边块(4条边中间的块12个)。其中中央块只有1个面&…

魔方还原公式

在开始魔方还原教程前,我们先来了解一下魔方的构造及其名称: R: 右侧面顺时针旋转,R’: 右侧面逆时针旋转, R2: 右侧面旋转180度 L: 左侧面 … 同理 F: 正面 … 同理 B: 背面 … 同理 U: 顶面 … 同理 首先要完成底面和底层的还原&#xff0…

三乘三魔方教程,按步骤来肯定能搞出来

分享一个我的公众号,最近突然想玩公众号,之前做过一段时间前端开发,考虑到现在应用程序越来越多,未来社会一定是一个充满“只有你想不到,没有你做不到”的App的世界!而微信小程序又给我们这群喜爱开发的童鞋…

[魔方]魔方七步初级教程

首先要学会怎么转魔方。好吧,你会转?学一下字母表示吧。 符号 F:前片(或叫层), B:后片, L:左片, R:右片, U:上片&a…

三阶魔方七步复原法

关于魔方,你需要知道: 无论怎么转,每一个面的最中间的块[图:1-面中心块]是固定不动的。所以每一面的中心块颜色决定了该面的颜色。无论怎么转,位于顶角的有三种颜色的块[图:2-顶角块]永远会在某一个顶角;位于棱中间的有…