SVM——超平面

article/2025/9/17 6:29:35

转载出处:超平面是什么?——理解超平面(SVM开篇之超平面详解)

引入

n维空间的超平面由下面的方程确定:

w T x + b = 0 w^Tx + b = 0 wTx+b=0

其中, w w w x x x都是n维列向量, x x x为平面上的点, w T w^T wT为平面上的法向量决定了超平面的方向, b b b是一个实数,代表超平面到原点的距离。且

x = ( x 1 , x 2 , . . . , x d ) T x = (x_1, x_2, ..., x_d)^T x=(x1,x2,...,xd)T
w = ( w 1 , w 2 , . . . , w d ) T w = (w_1, w_2, ..., w_d)^T w=(w1,w2,...,wd)T

那么 w T w^T wT为什么是法向量, b b b为什么是表示平面到原点的距离呢?

平面的概念

我们对“平面”的理解,一般是在三维空间中的,即

A x + B y + C z + D = 0 Ax + By + Cz + D = 0 Ax+By+Cz+D=0

这个平面有两个定义:

  1. 方程式线性的,是由空间点的各分量的线性组合
  2. 方程的数量是 1

这个平面是建立在“三维”上的。如果我们撇开“维度”这个限制,那么就有了超平面的定义。

超平面是纯粹的数学概念,不是物理概念,它是平面中的直线、空间中的平面的推广,只有当维度大于3,才称为“超”平面。

它的本质是自由度比空间维度小 1

何为自由度?

自由度的概念可以简单的理解为至少要给定多少个分量的值才能确定一个点. 例如, 三维空间里的(超)平面只要给定了(x,y,z)中任意两个分量, 剩下的一个的值就确定了. 先确定值的两个分量是自由的, 因为它们想取什么值就能取什么值;剩下的那个是"不自由的", 因为它的值已经由另外两确定了. 二维空间里的超平面为一条直线. 一维空间里超平面为数轴上的一个点。

举个栗子

通常,R2(二维空间)中的点集 i = ( x , y ) i = (x, y) i=(x,y) 满足等式 (点集 i i i 实际为一条直线):

a x + 1 / b y + c = 0 ( 1 ) ax + 1/by + c = 0(1) ax+1/by+c=0(1)
(这里使用1/b 是为了后续计算好表示)

其中, a , b , c a,b,c abc均为标量, a , 1 / b a,1/b a1/b至少有一个不为0.我们假设 b 不为0。那么

y = − a b x − c b y = -abx - cb y=abxcb

此时,使用换元法,令 t = x t = x t=x,(显然, t t t 为标量) 则点集 i ( x , y ) i (x,y) i(x,y) 可以表示成

i ( x , y ) = ( t , − a b t − c b ) = t ( 1 , − a b ) + ( 0 , − c b ) i (x,y) = ( t, -abt - cb) = t (1, -ab) + (0, -cb) i(x,y)=(t,abtcb=t(1,ab)+(0,cb)

之前说点集 i i i是一条直线,那么这条直线是什么?实际上就是过 ( 0 , − c b ) (0, -cb) (0,cb)点,方向为 ( 1 , − a b ) (1, -ab) (1,ab) 的直线 L。

更进一步,我们令向量 n = ( a , 1 / b ) n = (a, 1/b) n=(a,1/b)

则(1)可以表示为 n ∗ i + c = 0 n*i + c = 0 ni+c=0

此时,我们取在直线L上的一点,即子集 i i i 中的一个元素 p 0 ( x 0 , y 0 ) p_0(x_0,y_0) p0(x0,y0), 可以得到

n ∗ p 0 + c = 0 = > c = − n ∗ p 0 n* p_0 + c = 0 => c = -n*p_0 np0+c=0=>c=np0

则(2)可以改写为 n ( i − p 0 ) = 0 n(i - p_0) = 0 n(ip0)=0

因为 n n n ( i − p 0 ) (i - p_0 ) (ip0) 均是向量, ( i − p 0 ) (i - p_0) (ip0) 在直线 L 上, 所以, n n n 垂直直线L ,即 n n n为直线L的法向量

进一步解释超平面

给定向量空间 Rn 中的一个点 P 和一个非零向量 n n n ,满足

n ∗ ( i − p ) = 0 n * (i - p) = 0 n(ip)=0

则称点集 i 为通过点p 的超平面,向量 n 为通过超平面的法向量

点到超平面的距离

样本空间中的任意一点 x,到超平面 ( w , b ) (w,b) (w,b) 的距离,可以表示为

∣ w T + b ∣ ∣ ∣ w ∣ ∣ \frac{|w_T + b|}{|| w ||} wwT+b

证明也很简单:

对于超平面A w T x + b = 0 w^Tx + b = 0 wTx+b=0 假设 x‘ 为超平面上任意一点,那么,显然满足:

w T x ′ + b = 0 w^Tx' + b = 0 wTx+b=0

对于空间上任意一点 x, 到平面 A 的距离 d,等于 x 到超平面的法向量长度,也就是 向量 xx’ 在垂直方向上(即法向量)上的投影。而计算投影,将 xx’ 乘以法向量 w T w^T wT 即可。并且,我们不光要投影,还要计算单位,即使用单位为 1 的投影。也就是在分母除以 ∣ ∣ w ∣ ∣ || w || w。所以,距离 d 可以表示为:

d = ∣ w T ∣ ∣ w ∣ ∣ ( x − x ′ ) ∣ d = | \frac{w^T}{|| w ||}(x - x') | d=wwT(xx)

又因为

w T x ′ = − b w^Tx' = -b wTx=b

所以距离为

d = ∣ w T ( x − x ′ ) ∣ ∣ ∣ w ∣ ∣ = w T + b ∣ ∣ w ∣ ∣ d = \frac{|w^T(x - x')|}{|| w ||} = \frac{w^T + b}{||w||} d=wwT(xx)=wwT+b

判断超平面的正反

一个超平面可以将它所在的空间分为两半, 它的法向量指向的那一半对应的一面是它的正面, 另一面则是它的反面。如果利用数学来判断的话,需要利用到法向量 w T w^T wT

image


http://chatgpt.dhexx.cn/article/puwT5tFi.shtml

相关文章

超平面详解

学习SVM绕不开超平面的概念。先复习一些基础的概念(平面方程),帮助理解。 1. 平面及其方程: 因为平面与空间直线分别是曲面与空间曲线的特例,所以在讨论平面与空间直线以前,先引入有关曲面方程与空间曲线方…

轻松理解超平面

前言 定义: 1、超平面是指n维线性空间中维度为n-1的子空间。它可以把线性空间分割成不相交的两部分。比如二维空间中,一条直线是一维的,它把平面分成了两块;三维空间中,一个平面是二维的,它把空间分成了两块…

SVM理论疏导——什么是超平面

超平面概念 超平面是一种数学上的概念,它是线上的一个点,也是平面上的一条直线,也是三维空间的一张平面。前面说的点、线、平面都可以是超平面,但一般都不叫为超平面,因为超平面是点、线、平面的推广,即大于…

3、如何理解超平面?

参考:https://zhuanlan.zhihu.com/p/145706435 首先明确几个定义:(1) 超平面是指n维线性空间中维度为n-1的子空间。它可以把线性空间分割成不相交的两部分。比如二维空间中,一条直线是一维的,它把平面分成了两块;三维…

计算机内存与主存的关系(内存是主存吗?内存和主存有什么关系?)

在80386以上档次的微机中配置了高速缓冲存储器(Cache),这时内存包括主存与高速缓存两部分。 计算器内存条采用的是DRAM(动态随机存储器),即计算机的主存。通常所说的内存容量即指内存条DRAM的大小。 高速缓冲存储器Cache主要是为了解决CPU和主存速度不匹…

计算机内存图解

《电脑高手》也都是一笔带过。作为电脑中必不可少的三大件之一(其余的两个是主板与CPU),内存是决定系统性能的关键设备之一,它就像一个临时的仓库,负责数据的中转、暂存…… 不过,虽然内存对系统性能的至关…

计算机操作系统_内存管理

内存管理 设计程序模拟内存的动态分区内存管理方法。内存空闲区使用空闲分区表进行管理,采用最先适应算法从空闲分区表中寻找空闲区进行分配,内存回收时不考虑与相邻空闲区的合并。 假定系统的内存共640K,初始状态为操作系统本身占用40K。 …

关于计算机中内存的分类

**关于计算机中内存的分类(栈区,堆区,静态区)**1、栈区:主要用于函数的存储,从主函数开始,依次加入所引用的主函数。新加入的函数优先运行(类似于数据结构的栈)当一个函数…

计算机内存数值存储方式进制

进制概念 进制也就是进位制,是人们规定的一种进位方法。对于任何一种进制,x进制表示某一位置上的数运算时是逢x进一位。十进制是逢十进一、十六进制是逢十六进一、二进制是逢二进一。 各进制数表示 八进制是逢8进1,所以到8的时候向前进一位…

计算机内存结构!

变量的三大特点: 数据类型、作用域、存储类型 计算机的三大组成: 1.CPU 2.内存 3.硬盘 内存与硬盘的区别: 1.内存中保存动态数据,硬盘中保存静态数据。 2.断电后内存中的数据丢失,硬盘中的数据不会丢失。 3.执行程序时&#xff0c…

内存管理计算

一、补充概念 为了保证CPU执行指令时可正确访问存储单元,需将用户程序中的逻辑地址转换为运行时由机器直接寻址的物理地址,这一过程称为地址映射。地址映射一般是由硬件完成的;页表项的相关状态位由硬件确定。 最佳适应算法(空闲内…

计算机内存和磁盘的关系

计算机内存和磁盘的关系 前言 上篇文章详细讲了计算机内存的物理结构,逻辑结构以及在内存的基础上理解几种常见的数据结构。但是,计算机系统出了内存之外,还有一个非常重要的硬件,那就是磁盘。他们都是用于计算机存储&#xff0…

电脑硬件——内存

内存是一台电脑CPU与硬盘间进行数据传输的中转站,内存会影响着电脑的稳定性,不稳定的内存可能会导致蓝屏、黑屏、死机甚至电脑无法亮机等故障。 内存的作用: 在我们的电脑工作时,CPU和硬盘之间会无时不刻地进行大量的数据交换&am…

计算机(二):计算机存储系统(内存、外存)。

前言:我总结了汇编语言课本和通信书上的知识点给大家呈现。 一、计算机存储系统(文解): 存储分为:内存(内部存储器)、外存(外部存储器)。 内存分为:CPU上的寄…

计算机内存介绍

我们这里说的内存啊,其实就是说的我们电脑里面的内存条,所以嘞,内存就是内存条,数据要放在这上面才能被cpu读取从而做运算,还有硬盘,就是电脑中的C盘啥的,一个程序需要运行的话需要向内存申请一…

计算机的内存

1.内存的物理机制 内存和CPU一样,都是由大量引脚构成的集成电路,内存大致分为这几类:1.ROM:只能进行读取;2.DRAM:需要经常刷新就能进行保存数据的可被读取和写入的内存;3.SRAM:不需要经常刷新就…

【操作系统】计算机内存管理

文章目录 1.内存管理目标rom-ram2.计算机内存的惰性分配3.内存管理-分而治之思想4.内存不够的情况处理5.内存扩容swap配置实战6.Linux的free命令详解7.Linux的top命令详解 1.内存管理目标rom-ram (1)为啥要做内存管理 计算机不可能所以用户进程和系统所…

计算机|内存知多少

​1、硬件层面 内存就是名为内存IC的电子元件。(IC,集成电路,内存也是一种集成电路) 内存IC的引脚配置 那这个内存IC能存多少数据? 数据信号引脚有D0~D7一共8个,表示一次输入输出8位数据(一个字…

计算机底层知识之内存

❝ 渔夫出海前,并不知道鱼在哪里,可是他们还是选择出发, 因为他们相信,一定会满载而归。人生很多时候,是「选择了才有机会,是相信了才有可能」。 -- 「稻盛和夫」 ❞ 大家好,我是「柒八九」。 …

计算机基础之内存

目录 1.什么是内存2.内存的物理结构3.内存的使用4.数据在内存中为什么用二进制表示5.二进制的补码 1.什么是内存 内存是与cpu沟通的桥梁,计算机中所有程序的运行都要依靠内存,内存对计算机的影响非常大,内存又被称为主存,作用就是…