矩阵低秩有何意义?

article/2025/9/14 14:53:23

参考博客:https://blog.csdn.net/weixin_41894030/article/details/115699611

首先来思考,为什么叫“秩”?

举个例子就很容易理解,大家排队买票。如果大家互相不认识,那就会一个排一个,非常有秩序。然而,如果突然来了一个与队伍前面的人认识的人,这个人又不自觉排队,非要插队。那后面的人肯定要有意见了,说你要是这样我前面 还有认识的人呢,你插我也插队,这样整个队伍就乱掉了, 谁也买不成。

通过这个例子,可以得到一下结论:彼此不认识,那就不相关,就有秩序,问题就好解决;反之,彼此相关,就没有秩序,问题就不好解决。

所以,数学中定义,矩阵中最大的不相关的向量的个数,叫做秩,可以理解为有秩序的程度。

从社会学角度考虑一下,政府机关是讲人际关系的地方,可谓是关系错综复杂,通常都是近亲繁殖。显然,这些部门用矩阵来说,就不满秩,秩非常小。可以想象这些地方的工作肯定是搞不好的,因为没有秩序。所以想找个好单位,满秩可以作为一项评价指标哦~~~

一、低秩矩阵中低秩(Low-rank)的意义

1,问题的引出——对低秩矩阵分解中低秩的误解

        论文《Privileged Matrix Factorization for Collaborative Filtering》是我在推荐系统研究方向上所读的第一篇论文(针对该篇论文,请看总结点击打开链接),当时对矩阵分解的理解是:评分矩阵X分解成两个隐特征矩阵U和V,U代表用户隐特征矩阵,V代表商品隐特征矩阵。U和V的隐因子向量的长度为k,其中k<<min{m,n},自己也就理解成了分解后的两个矩阵的秩是比原来的评分矩阵X的秩低很多,所以就把该方法称为低秩矩阵分解法。

        在我查阅了大量资料后,事实证明我对低秩矩阵分解中的低秩的意义理解是错误的。那么低秩(Low-rank)的意义到底代表什么呢,请看下面的解释

2,低秩矩阵分解中低秩的意义

        我们先来回忆下线性代数里面“秩”到底是啥?举个简单的例子吧:

对上面的线性方程组,第一个方程和第二个方程有不同的解,而第2个方程和第3个方程的解完全相同。从这个意义上说,第3个方程是“多余”的,因为它没有带来任何信息量,把它去掉,所得的方程组与原来的方程组同解。为了从方程组中去掉多余的方程,自然就导出了“矩阵的秩”这一概念。

还记得我们怎么手工求矩阵的秩吗?为了求矩阵A的秩,我们是通过矩阵初等变换把A化为阶梯型矩阵,若该阶梯矩阵有r个非零行,那么A的秩rank(A)就等于r。从物理意义上来讲,矩阵的秩度量的就是矩阵的行列之间的相关性。如果矩阵的各行或列是线性无关的,矩阵就是满秩的,也就是秩等于行数。回到上面线性方程组来说,因为线方程组可以用矩阵描述。秩就表示了有多少个有用的方程。上面的方程组有3个方程,实际上只有2个有用的,一个是多余的,所以对应的矩阵的秩是2.

ok,既然秩可以度量相关性,而矩阵的相关性实际上就表示了矩阵的结构信息。如果矩阵之间各行的相关性很强,那么就表示这个矩阵实际可以投影到更低维的线性子空间,也就是用几个向量就可以完全表达了,它就是低秩的。所以总结的一点就是:如果矩阵表达的是结构性信息,例如图像、用户-商品推荐表等,那么这个矩阵各行之间存在一定的相关性,那这个矩阵一般是低秩的。

如果X是一个m行n列的数值矩阵,rank(x)是x的秩,假如rank (X)远小于m和n,则称x是低秩矩阵。低秩矩阵每行或每列都可以用其他的行或列线性表示,可见它包含大量的冗余信息。利用这种冗余信息,可以对数据进行恢复,也可以对数据进行特征提取。

总结一下:矩阵的秩的度量其实就是矩阵的行列之间的相关性。如果矩阵的各行或列是线性无关的,矩阵就是满秩的。非零元素的行数或列数决定了秩的多少。

低秩矩阵    原文链接:https://blog.csdn.net/gcheney/article/details/100633881

低秩是指矩阵的秩比较小,而矩阵的低秩性是指矩阵的秩相对矩阵的行数或列数而言很小。

图像处理中,rank可以理解为图像所包含的信息的丰富程度,在现实生活中,一张图片大部分是相似的。比如一张大草原的图片可以理解为,草原是由很多草组成的,而草是相似的,所以如果全是草,那么这张图所包含的信息量是很少的的,因为可以理解为草是草的复制品。而图中的蒙古包,人,马之类的则可以理解为图片所包含的信息,实际上,相对于只有草的草原图片和有草和蒙古包的草原图片,后者的秩是较高的。也就是说,图片中比较突兀的成分,比如蒙古包,比如人像照片中的红眼亮点,会增加图像矩阵的秩。而现实生活中一张不错的图片的秩其实是比较低的,如果图像的秩比较高,往往是因为图像中的噪声比较严重。比如拍照的时候ISO感光度设置过高造成噪点太过泛滥之类的。所以,图像处理的低秩性其实可以拿来去除照片中的噪点,电影中的雨丝也可以通过低秩表达的方式来去除。

低秩与稀疏。低秩是指矩阵的秩较小,稀疏是指矩阵中非零元素的个数少。如果对矩阵进行奇异值分解,并把其所有奇异值排列为一个向量,那么这个向量的稀疏性便对应于该矩阵的低秩性

3.低秩(Low-rank)的意义

由矩阵秩的定义知道,若将图像看成一个矩阵,那么它的基的数量越少,基对应的线性无关向量数量就越少,矩阵的秩就越小。当它远远小于矩阵的大小的时候,图像就是低秩的。低秩矩阵的每行或者每列都可以用其他的行或者列线性表示,这说明这个矩阵包含了大量的冗余信息。利用这种冗余信息可以对确实图像信息进行恢复,可以将多出来的噪声信息进行去除,还可以对错误的图像信息进行恢复。

我们可以利用图像的低秩性来恢复图像,首先构建融合了低秩矩阵先验的模型,再求解这个模型得到低秩的矩阵。这种基于低秩矩阵逼近(LOW-Rank Matrix Approximation,LRMA)的模型称为低秩矩阵恢复模型(LRMR)。目前,LRMR主要有鲁棒主成分分析robust PCA,(RPCA)、矩阵补全(matrix completion,MC)和低秩表示(low-rank representation,LRP)等三类模式。

原文链接:https://blog.csdn.net/gcheney/article/details/100633881

二、矩阵填补(Matrix Completion)

矩阵填补的应用很广泛,论文《Matrix completion by deep matrix factorization》就给出了矩阵填补的两个应用:图像修复(image inpainting)、协同过滤(Collaborative filtering)。

        图像修复:简单来说就是通过矩阵填补模型将“打码”的图片修复成原来的图片,如下图所示:

 协同过滤:是推荐系统的一种模型,该方法通过分析用户的历史记录(主要是用户-商品评分矩阵)来给用户做出推荐。例如我们在看一部电影的时候,如果喜欢看,就会给它打个分,例如3颗星。然后系统,例如Netflix等知名网站就会分析这些数据,看看到底每部影片的题材到底是怎样的?针对每个人,喜欢怎样的电影,然后会给对应的用户推荐相似题材的电影。但有一个问题是:我们的网站上面有非常多的用户,也有非常多的影片,不是所有的用户都看过说有的电影,不是所有看过某电影的用户都会给它评分。假设我们用一个“用户-影片”的矩阵来描述这些记录,例如下图,可以看到,会有很多空白的地方。如果这些空白的地方存在,我们是很难对这个矩阵进行分析的,所以在分析之前,一般需要先对其进行补全。也叫矩阵填充。

 那到底怎么填呢?如何才能无中生有呢?每个为0的地方的信息是否蕴含在其他已有的信息之上了呢?如果有,怎么提取出来呢?Yeah,这就是低秩生效的地方了。这叫低秩矩阵重构问题,它可以用如下的模型表述:已知数据是一个给定的m*n矩阵A,如果其中一些元素因为某种原因丢失了,我们能否根据其他行和列的元素,将这些元素恢复?当然,如果没有其他的参考条件,想要确定这些数据很困难。但如果我们已知A的秩rank(A)<<m且rank(A)<<n,那么我们可以通过矩阵各行(列)之间的线性相关将丢失的元素求出。你会问,这种假定我们要恢复的矩阵是低秩的,合理吗?实际上是十分合理的,比如一个用户对某电影评分是其他用户对这部电影评分的线性组合。所以,通过低秩重构就可以预测用户对其未评价过的视频的喜好程度。从而对矩阵进行填充。


http://chatgpt.dhexx.cn/article/xrZcau62.shtml

相关文章

如何直观地理解矩阵的秩?

矩阵的秩可以直观地理解为筛眼的大小&#xff1a; 下面就来解释这句话是什么意思&#xff1f; 1 矩阵的作用 假设对于向量 x1 、 x2、 x3、x4 有&#xff1a; 上述关系可以用图像来表示&#xff0c;左侧的向量 x1 、 x2、 x3、x4&#xff0c;在 A 的作用下&#xff0c;变为了…

矩阵的秩(Rank)

定义 一个矩阵 A 的列秩是 A 的线性无关的纵列的极大数目。类似地&#xff0c;行秩是 A 的线性无关的横行的极大数目。矩阵的列秩和行秩总是相等的&#xff0c;因此它们可以简单地称作矩阵 A 的秩。通常表示为 r(A)&#xff0c;rank(A) 或 rk(A)。 可替代定义 用行列式定义…

如何理解矩阵的「秩」?

本文作者Heshawn&#xff0c;点击关注&#xff0c;转载需授权。 利益相关&#xff1a;知乎『线性代数』系列Live主讲人 小时候老师总告诉我们「要有n个方程才能确定地解出n个未知数」——这句话其 实是不严格的&#xff0c;如果你想确定地解出n个未知数&#xff0c;只有n个方程…

矩阵的秩及其求法

矩阵的秩及其求法 矩阵秩的概念k阶子式矩阵的秩 矩阵秩的求法1、子式判别法&#xff08;定义&#xff09;2、用初等行变换求矩阵的秩 满秩矩阵相关性质 矩阵秩的概念 k阶子式 定义1&#xff1a; 设 A ( a i j ) m n A(a_{ij})_{m\times n} A(aij​)mn​在 A A A中任取 k k …

PPM与mg/m3的转换公式

转载于; https://blog.csdn.net/zhuisaozhang1292/article/details/88082631 版权声明&#xff1a;本文为博主原创文章&#xff0c;遵循 CC 4.0 BY-SA 版权协议&#xff0c;转载请附上原文出处链接和本声明。 本文链接&#xff1a;https://blog.csdn.net/zhuisaozhang1292/a…

用stm32读取遥控器接收机PPM信号各通道值

引言 无人机遥控器接收机接收方式可以在遥控上设置成PPM模式和S.BUS模式&#xff0c;用示波器观察接收机信号输出引脚可以得到一系列的方波&#xff0c;很像PWM方波&#xff0c;而我们所需要的是七&#xff0c;八个或更多的通道信号&#xff0c;多路的PWM信号调制在同一通道上…

气体浓度PPM与mg/m3的换算关系

1&#xff09;换算方法之一&#xff1a;《空气和废气检测分析方法&#xff08;第四版增补版&#xff09;》&#xff08;中国环境科学出版社&#xff09;空气中气体污染物浓度的表示方法 空气中污染物的浓度是以单位体积内所含污染物的质量来表示&#xff0c;即毫克每立方米…

ppm与LSB含义,换算

n表示ADC位数 关于PPM与LSB 一、ppm&#xff1a;百万分之一 ppm是英文part per million的缩写&#xff0c;表示百万分之几&#xff0c;在不同的场合与某些物理量组合&#xff0c;常用于表示器件某个直流参数的精度。下面举例说明。 1.用于描述电压基准&#xff08;Voltage …

理学知识01-ppm、ppb、ppt换算

1. 浓度 浓度是分析化学中的一个名词。含义是以1升溶液中所含溶质的摩尔数表示的浓度。以单位体积里所含溶质的物质的量&#xff08;摩尔数&#xff09;来表示溶液组成的物理量&#xff0c;叫作该溶质的摩尔浓度&#xff0c;又称该溶质物质的量浓度。 2. 浓度单位 在文献阅读过…

元器件温度系数(ppm/℃)是什么?

温漂也称为零点漂移或者温度漂移&#xff0c;一般指环境温度变化时引起半导体参数的变化&#xff0c;这样会造成静态工作点的不稳定&#xff0c;使电路动态参数不稳定&#xff0c;甚至使电路无法正常工作。 温度系数是材料的物理属性随着温度变化而变化的速率。常用单位是&…

SPP、ASPP与PPM

SPP、ASPP与PPM SPPPPMASPP SPP SPP模块是何凯明大神在2015年的论文《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》中被提出。 在R-CNN中需要固定输入图片的尺寸&#xff0c;因为卷积层后面的全连接层的结构是固定的。但在现实中&#xf…

PPM文件

PPM文件 简介文件分类及扩展举例 简介 PPM&#xff08;Portable Pixmap Format&#xff09;是一种简单的图像格式&#xff0c;仅包含格式、图像宽高、bit数等信息和图像数据。 用txt打开.ppm文件的话&#xff0c;文件内容会如下所示: 文件分类及扩展 除开PPM还有两个与之相关…

ppm理解与代码实现

PWM指的是脉宽调制,狭义说就是舵机信号中正脉冲宽度,就是高电平宽度来表示控制量大小,PPM是脉冲和脉冲之间间隔调制,狭义的说,对于遥控器输出或者接收机输出而言,两个脉冲上升沿之间间隔表示控制量大小.在遥控设备的传统中PWM通常是单通道的控制量,而PPM则是以帧为单位,帧内每个…

[图像处理] PPM、PGM、PBM图像格式剖析

今天突然需要用到PPM这个图像文件格式&#xff0c;之前没见过&#xff0c;在此记录一下。 PPM、PGM、PBM这三个图像文件格式很少见&#xff0c;其实也不难&#xff0c;分别用于彩色图像、灰度图像、二值图像。这里以PPM格式为例。 PPM格式有两种类型&#xff1a;字节码和ASCII。…

PPM文件格式详解

PPM图像格式是由Jef Poskanzer 在1991年所创造的。 PPM&#xff08;Portable Pixmap Format&#xff09;还有两位兄长&#xff0c;大哥名叫「PBM」&#xff0c;二哥人称「PGM」&#xff0c;他们三兄弟各有所长&#xff0c;下面为你们一一介绍&#xff1a; PBM 是位图&#xf…

什么是ppm,如何转化到西格玛水平

本文共678字&#xff0c;预计阅读需要2.5分钟 我们经常听到&#xff0c;如果一家公司的质量水平达到了六个西格玛水平&#xff0c;那么也就意味着在100万次出错机会中出现的缺陷数不会超过3.4个&#xff0c;也就是3.4ppm。那ppm到底是什么呢&#xff1f; ppm是英文parts per mi…

PPM信号介绍

原文地址&#xff1a;http://nicekwell.net/blog/20161223/ppmxin-hao-jie-shao.html 我们知道PWM信号可以控制舵机&#xff0c;一般信号周期是20ms&#xff0c;脉宽在500us~2500us之间。   实际上这种pwm信号不仅可以控制舵机&#xff0c;航模中使用的电调&#xff08;有刷和…

晶振PPM指标、频率和时间偏差

目录 PPM的含义频率随温度的变化振荡器的分类 PPM的含义 PPM是Parts Per Million的缩写&#xff0c;定义为百万分之一&#xff0c;1ppm即是一百万分之一。 PPM是晶振、TCXO等振荡器的一个重要参数&#xff0c;它代表频率误差的精准度&#xff0c;PPM值越小越精准。 频率随温度…

Laravel快速接入JWT用户认证(多用户认证)tymon/jwt-auth

JWT应用 创建新项目安装快速接入创建 Token 完成接口多用户认证创建 Admin JWT 是 JSON Web Token 的缩写&#xff0c;它是一个规范&#xff0c;让用户和服务器之间传递安全可靠的信息。 创建新项目 创建一个 Laravel的新项目&#xff0c;我们依然推荐大家使用 LTS 的版本&am…