二、线性代数

article/2025/10/5 8:07:08

6 特殊类型的矩阵和向量

对角矩阵

对角矩阵(diagonal matrix)只在主对角线上含有非零元素,其他位置都是零。形式上,矩阵 D D D 是对角矩阵,当且仅当对于所有的 i ≠ j , D i , j = 0 i\ne j, \ D_{i,j}=0 i=j, Di,j=0。单位矩阵就是最常见的一种对角矩阵,对角元素全部是 1。我们用 d i a g ( v ) diag(v) diag(v) 表示一个对角元素由向量 v v v 中元素给定的对角方阵。对角矩阵受到关注的部分原因是对角矩阵的乘法计算很高效。计算乘法 d i a g ( v ) x diag(v)x diag(v)x,我们只需要将 x x x 中的每个元素 x i x_i xi 放大 v i v_i vi 倍。换言之, d i a g ( v ) x = v ⊙ x diag(v)x=v\odot x diag(v)x=vx。计算对角方阵的逆矩阵也很高效。对角方阵的逆矩阵存在,当且仅当对角元素都是非零值,在这种情况下, d i a g ( v ) − 1 = d i a g ( [ 1 / v 1 , … , 1 / v n ] T ) diag(v)^{-1}=diag([1/v_1,\dots,1/v_n]^T) diag(v)1=diag([1/v1,,1/vn]T)。在很多情况下,我们可以根据任意矩阵导出一些通用的机器学习算法;但通过将一些矩阵限制为对角矩阵,我们可以得到计算代价较低的(并且简明扼要的)算法。

不是所有的对角矩阵都是方阵。长方形的矩阵也有可能是对角矩阵。非方阵的对角矩阵没有逆矩阵,但我们仍然可以高效地计算它们的乘法。对于一个长方形对角矩阵 D D D 而言,乘法 D x Dx Dx 会涉及到 x x x 中每个元素的缩放,如果 D D D 是瘦长型矩阵,那么在缩放后的末尾添加一些零;如果 D D D 是胖宽型矩阵,那么在缩放后去掉最后一些元素。

对称矩阵

对称(symmetric)矩阵是转置和自己相等的矩阵:

A = A T ( 2.35 ) A=A^T\quad\quad\quad\quad\quad\quad\quad(2.35) A=AT(2.35)

当某些不依赖参数顺序的双参数函数生成元素时,对称矩阵经常会出现。例如,如果 A A A 是一个距离度量矩阵, A i , j A_{i,j} Ai,j 表示点 i i i 到点 j j j 的距离,那么 A i , j = A j , i A_{i,j} = A_{j,i} Ai,j=Aj,i,因为距离函数是对称的。

单位向量

单位向量(unit vector)是具有 单位范数(unit norm)的向量:

∥ x ∥ 2 = 1 ( 2.36 ) \Vert x\Vert_2=1\quad\quad\quad\quad\quad(2.36) x2=1(2.36)

正交

如果 x T y = 0 x^Ty=0 xTy=0,那么向量 x x x 和向量 y y y 互相 正交(orthogonal)。如果两个向量都有非零范数,那么这两个向量之间的夹角是 90 度。在 R n \mathbb{R}^n Rn中,至多有 n n n 个范数非零向量互相正交。如果这些向量不仅互相正交,并且范数都为 1,那么我们称它们是标准正交(orthonormal)

正交矩阵

关于正交矩阵的理解

正交矩阵(orthogonal matrix)是指行向量和列向量是分别标准正交的方阵:

A T A = A A T = I ( 2.37 ) A^TA=AA^T=I\quad\quad\quad\quad\quad(2.37) ATA=AAT=I(2.37)

这意味着

A − 1 = A T ( 2.38 ) A^{-1}=A^T\quad\quad\quad\quad\quad(2.38) A1=AT(2.38)

所以正交矩阵受到关注是因为求逆计算代价小。我们需要注意正交矩阵的定义。违反直觉的是,正交矩阵的行向量不仅是正交的,还是标准正交的。对于行向量或列向量互相正交但不是标准正交的矩阵,没有对应的专有术语。

7 特征分解

特征分解(eigendecomposition)是使用最广的矩阵分解之一,即我们将矩阵分解成一组特征向量和特征值。

方阵 A A A 的 特征向量(eigenvector)是指与 A A A 相乘后相当于对该向量进行缩放的非零向量 v v v

A v = λ v ( 2.39 ) Av=\lambda v\quad\quad\quad\quad(2.39) Av=λv(2.39)

标量 λ \lambda λ被称为这个特征向量对应的特征值(eigenvalue)。(类似地,我们也可以定义 左特征向量(left eigenvector) v T A = λ v T v^TA=\lambda v^T vTA=λvT,但是通常我们更关注 右特征向量(right eigenvector))。

如果 v v v A A A 的特征向量,那么任何缩放后的向量 s v sv sv ( s ∈ R , s ≠ 0 s\in\mathbb{R},s\ne0 sR,s=0) 也是 A A A 的特征向量。此外, s v sv sv v v v 有相同的特征值。基于这个原因,通常我们只考虑单位特征向量。

假设矩阵 A A A 有 n 个线性无关的特征向量 { v ( 1 ) , … , v ( n ) } \{v^{(1)},\dots,v^{(n)}\} {v(1),,v(n)},对应着特征值 { λ 1 , … , λ n } \{\lambda_1,\dots,\lambda_n\} {λ1,,λn}。我们将特征向量连接成一个矩阵,使得每一列是一个特征向量: V = [ v ( 1 ) , … , v ( n ) ] V=[v^{(1)},\dots,v^{(n)}] V=[v(1),,v(n)]。类似地,我们也可以将特征值连接成一个向量 λ = [ λ 1 , … , λ n ] T \lambda=[\lambda_1,\dots,\lambda_n]^T λ=[λ1,,λn]T。因此, A A A的特征分解可以记作:

A = V d i a g ( λ ) V − 1 ( 2.40 ) A=V diag(\lambda)V^{-1}\quad\quad\quad\quad(2.40) A=Vdiag(λ)V1(2.40)

我们已经看到了构建具有特定特征值和特征向量的矩阵,能够使我们在目标方向上延伸空间(?)。然而,我们也常常希望将矩阵 分解(decompose)成特征值和特征向量。这样可以帮助我们分析矩阵的特定性质。

不是每一个矩阵都可以分解成特征值和特征向量。在某些情况下,特征分解存在,但是会涉及复数而非实数。幸运的是,我们通常只需要分解一类有简单分解的矩阵。具体来讲,每个实对称矩阵都可以分解成实特征向量和实特征值:

A = Q Λ Q T ( 2.41 ) A=Q\Lambda Q^T\quad\quad\quad\quad\quad\quad(2.41) A=QΛQT(2.41)

其中 Q Q Q A A A 的特征向量组成的正交矩阵, Λ \Lambda Λ 是对角矩阵。特征值 Λ i , i \Lambda_{i,i} Λi,i 对应的特征向量是矩阵 Q Q Q 的第 i i i 列,记作 Q : , i Q_{:,i} Q:,i。因为 Q Q Q 是正交矩阵,我们可以将 A A A 看作沿方向 v ( i ) v^{(i)} v(i)延展 λ i \lambda_i λi 倍的空间。如图2.3 所示:

在这里插入图片描述

待补充 66


http://chatgpt.dhexx.cn/article/L2ZdYw0A.shtml

相关文章

边缘计算与雾计算的区别

雾计算是对MEC的扩展,扩展到了终端侧,包括计算、存储、存储、控制功能。区别如下: 1.MEC使用的资源是网络边缘的设备,而雾计算还要使用终端设备。 2.雾计算是使得云到物的计算无缝连续衔接。 3.雾计算为垂直行业和应用除提供电信业…

雾计算、边缘计算区别和联系

01 从计算方式上边来说的话,雾计算的层次性稍微强一点,并且架构方面比较平坦,这样下来的话整个计算的平稳性就比较好一点。 02 对于边缘计算来说的话,边缘计算在进行计算的时候是不会对网络产生依赖的,也就是说边缘计算…

雾计算机和云计算机哪个好,怎么理解云计算和雾计算还有边缘计算

此外,《数据时代 2025》还预测,2025 年数据量产生的大主体将由消费者转移到企业,届时企业产生的数据量将占到数据总量的 60%。企业领导者将可以从这些海量数据信息和其价值中获得新的商业机遇,但同时也需要对收集、使用和存储数据…

雾计算-思科白皮书 原文+翻译 | 带你全面官方解读雾计算

前言 预感近阶段雾计算会被再次炒起,众所周知雾计算的概念是思科提出来的,于是找来思科白皮书,却是英文版,闲来无事借google翻译将PDF翻译并排版,方便更多的人认识原汁原味的雾计算。 雾计算和物联网:将云…

[Spark基础]--雾计算

wiki解释 雾计算(英语:Fog Computing)或雾联网(fog networking,或fogging),是使用最终用户终端设备或连接最终用户设备的边缘设备,以分布式协作架构进行数据存储(相较于将…

AI之边缘计算、雾计算云计算技术分析

边缘计算产生背景: 随着移动智能设备的普及以及5G等无线通信技术的发展,涌现出许多具有低延迟要求的计算密集型应用,如在线沉浸式游戏、增强现实和视频流分析等. 由于传统的云计算无法满足这些应用对低延迟的需求,研究者提出了一种新型的计算模式,称为边缘计算. 边…

第三章-云计算边缘计算雾计算

【前言】随着万物互联时代的到来,网络边缘设备产生的数据量快速增加,带来了更高的数据传输带宽需求。于此同时,新型应用也对数据处理的实时性提出了更高要求,传统云计算模型已经无法有效应对,边缘计算、雾计算应用而生…

云计算、雾计算、边缘计算、移动边缘计算和自动驾驶的关系

什么是云计算呢? 简单来说,云计算就是将很多计算机资源和服务集中起来,人们只要接入互联网,将能很轻易、方便的访问各种基于云的应用信息,省去了安装和维护的繁琐操作。 当然,个人和企业也能使用云计算中心…

【笔记】雾计算中移动应用的优先级约束任务调度

目录 前置 摘要 介绍 模型 应用模型 计算和通信模型 能耗模型 问题定义 NP难 预功率分配算法 能量约束调度 算法1:具有启发式H的能量约束列表调度(ECLS-H) 时间约束调度 算法2:具有启发式H的时间约束列表调度&#…

文章云计算的兄弟,雾计算要来了

转自: http://tech.china.com/news/company/892/20160219/21553952_all.html#page_2 现在正在流行的“云计算”,是把大量数据放到“云”里去计算或存储。这样,就解决了目前电脑或手机存储量不够,或者是运算速度不够快的问题&#…

话题 | 雾计算和边缘计算有什么区别?

原文:http://readwrite.jp/infrastructure/32649/ 随着物联网的发展,经常听到「雾计算」和「边缘计算」这样的单词。 雾计算这个词相对来说是最近出现的一个词。因为和云相比位置上更接近设备,所以表示为雾,它是作为实现IoT的结构…

边缘计算和雾计算什么关系_什么是雾计算?

边缘计算和雾计算什么关系 By now most people are more than familiar with the concept of Cloud Computing, but what about the new concept referred to as Fog Computing? Today’s Q&A post takes a look at this new concept and how it differs from Cloud Compu…

【知识积累】Edge vs Fog Computing 边缘计算和雾计算的基本介绍

前言 边缘计算和雾计算都可以被定义为技术平台,使计算过程更接近数据产生和收集的地方,以下详细解释了这两个概念。 顾名思义,边缘计算发生在应用网络的“边缘”。从拓扑结构上看,“边缘计算机”在网络的端点上(如控…

大话:边缘计算、雾计算、云计算

云计算 一种利用互联网实现随时随地、按需、便捷地使用共享计算设施、存储设备、应用程序等资源的计算模式。 云计算系统由云平台、云存储、云终端、云安全四个基本部分组成,云平台从用户的角度可分为公有云、私有云、混合云等。 通过从提供服务的层次可分为&#x…

边缘计算与雾计算

现在人们常将云计算、边缘计算、雾计算放在一起来讨论,而云计算大家都很熟悉了,但是往往很难搞清楚什么是边缘计算,什么是雾计算,而网络上的文章多为长篇大论,又说不清楚,本文将尽量用浅显明了的方式对其进…

雾计算主要有哪些优点,主要面临哪些挑战?

雾平台由数量庞大的雾节点(即上文中雾使用的硬件设备,以及设备内的管理系统)构成。这些雾节点可以各自散布在不同地理位置,与资源集中的数据中心形成鲜明对比。 根据以上内容,可以总结出雾计算与云计算的不同&#xf…

区分云计算,边缘计算,雾计算

物联网架构 Edge Layer之下应该还有一个:Device Layer 设备层负责物联网设备的传感器采集、监控、数据的实时分析(需要使用其他技术)等信息。 物联网架构中,服务组织是自下向上的,即边缘计算的结果可以提供给雾计算用于…

雾计算

雾计算,也称为雾或雾化的联网. 其目标是改善效率的雾化和减少的数据传送到云端进行处理、分析和存储。这往往改善效率,尽管它也可用于安全和合规原因。 普适计算应用包括雾智能电网,智慧城市,智能楼宇车辆网络,和软件…

雾计算?边缘计算?云里雾里还被边缘?

雾计算?边缘计算?云里雾里还被边缘? 我们都知道云计算,近两年又出现了雾计算、边缘计算,搞得人云里雾里分不清。这些概念究竟是什么意思?和我们的生活有什么关系?这篇文章来一探究竟。 1、雾计算…

什么是雾计算?

什么是雾计算: 去中心化和灵活性是雾计算和云计算的主要区别。雾计算,也称为雾网络或雾化,描述了一种分散的计算结构,位于云和产生数据的设备之间。这种灵活的结构使用户能够将资源(包括应用程序及其生成的数据&#…