SVM 推导

article/2025/9/13 6:18:36

参考

http://www.cnblogs.com/jerrylead/archive/2011/03/13/1982639.html
http://blog.csdn.net/sinat_22594309/article/details/61615946
http://blog.csdn.net/v_july_v/article/details/7624837

理解SVM

函数间隔->几何间隔->拉格朗日算子->KTT条件


函数间隔

这里写图片描述

全局样本上的函数间隔
这里写图片描述


几何间隔

这里写图片描述

全局样本上的几何间隔
这里写图片描述


拉格朗日对偶

有不等式约束的极值问题求法

这里写图片描述
这里写图片描述

KKT条件


最优化间隔分类器

目标:最大化几何间隔

这里写图片描述

求最小的那一项里就是我们的函数间隔,函数间隔有什么性质?可控可变乖巧听话,所以我们令所有样本的函数间隔都大于等于1,这样后面一项就变成1了,那么优化目标就变成

这里写图片描述

可以把优化问题变成一个带约束的最小化问题,利用拉格朗日乘子法,构建拉格朗日函数

这里写图片描述

求这个函数的最大值,由于alpha始终大于等于0,[若alpha取小于0,那么最大值为无穷大]。所以对于函数间隔不是1的点而言,其对应的alpha一定等于0才能取到最大值,因此我们就有了拉格朗日函数的最大值就是第一项,我们想优化的目标函数,因此优化目标变成了
这里写图片描述

这里根据拉格朗日对偶性将这个极小极大问题转换成极大极小问题,也就是先对w,b求最小值,再求对alpha的最大值。极小问题就转化成求偏导为0,也就是

这里写图片描述

有了这两个等式,我们再把他们回代到拉格朗日函数当中,有

这里写图片描述

这里写图片描述

这里写图片描述

现在拉格朗日函数中需要优化的参数变成了alpha一个,现在只要求得了alpha的最佳值就解决了我们一开始的优化问题,也就是最后需要我们做的工作就是

这里写图片描述

实际的应用中,当我们解决了上述最优问题之后,我们再回过来求w,b的最优值。W的值很明显,根据上面求导所得的公式进行计算就成,但b的取值怎么求呢?这需要我们回到梦开始的地方,一开始我们就做了一个约束,要求对所有的样本函数间隔都大于等于1,一会儿就要用到这个。首先,alpha不可能全为0,假如alpha全为0则w也为0,我们知道样本有正负两类,这样y(wx+b)=yb不能保证始终大于1,所以必有不等于0的alpha,而对于不等于0的alpha对应的函数间隔必然为1能保证拉格朗日函数的极大值与我们一开始的优化目标等价,所以通过找到一个支持向量,使用 b=yi−wxi
这里写图片描述
我们来观察一下上面这个式子,alpha中大部分都是0的,只在少数函数间隔为1的样本处不为0,那么这样的话w,b的取值就只和这些样本有关,其他的样本根本没有地位啊,为了突出这些样本与众不同的地位,我们把它们称为支持向量,超平面的选择之和他们有关~


http://chatgpt.dhexx.cn/article/pEtahB2p.shtml

相关文章

SVM 原理详细推导

SVM 原理详细推导 1 硬间隔最大化1.1 函数间隔与几何间隔1.2 间隔最大化1.3 凸二次规划问题求解1.4 一个求解例子 2 软间隔最大化3 线性不可分问题参考 SVM 是一个分类模型,如果训练数据可以完全用一个超平面分开,则称数据集为完全线性可分的&#xff0c…

机器学习笔记:线性SVM推导

什么是SVM 支持向量机简称SVM是最大化分类间隔的线性分类器,如果使用核函数,可以解决非线性问题。支持向量机的目标是寻找一个分类超平面,它不仅能正确的分类每一个样本,并且要使得每一类样本中距离超平面最近的样本到超平面的距…

SVM推导过程浅析

转载请注明出处,原文地址 前言 SVM - support vector machine, 俗称支持向量机,为一种supervised learning算法,属于classification的范畴。本篇文章将会讲述SVM的原理并介绍推导过程。 SVM推导过程 如图,我们有些红色与蓝色点…

svm推导

自己推一遍才印象深刻,CSDN对公式的支持很不好,所以在本地用latex写,并转换成了图片上传

【超详细】支持向量机(SVM)数学推导

目录 一、硬间隔SVM(Hard Margin SVM) 二、对偶问题(Dual Problem) 1.将有约束问题转变为无约束问题 2.强对偶关系 3.计算拉格朗日函数的最小值 4.得到对偶形式 三、对偶形式的求解 1.KKT条件的引入 2.计算w*和b* 四、软间隔SVM(Soft M…

svm原理详细推导

笔者在查阅了大量资料和阅读大佬的讲解之后,终于对svm有了比较深一点的认识,先将理解的推导过程分享如下: 本文主要从如下五个方面进行介绍:基本推导,松弛因子,核函数,SMO算法,小结…

支持向量机SVM推导及求解过程

支持向量机是属于原创性、非组合的具有明显直观几何意义的分类算法,具有较高的准确率。 使用SVM算法的思路:(1)简单情况,线性可分情况,把问题转化为一个凸优化问题,可以用拉格朗日乘子法简化&am…

SVM 公式推导

1、SVM思想 (1)SVM算法的依据就是分类器B的分类间隔比分类器C的分类间隔大。这里涉及到第一个SVM独有的概念”分类间隔”。在保证决策面方向不变且不会出现错分样本的情况下移动决策面,会在原来的决策面两侧找到两个极限位置(越过…

机器学习笔记之十二——SVM原理及推导

svm(support vector machine)是一种二分类算法,它的目标在于寻找一个能将两种点分离的直线或平面或超平面。 如图(来自wiki): 图中的红线将两边数据点分开,这条线就是分割直线,同样…

DFS与DP算法

名词解释: DFS(Dynamic Plan):动态规划 DFS(Depth First Search):深度优先搜索 DFS与DP的关系 很多情况下,dfs和dp两种解题方法的思路都是很相似的,这两种算法在一定程度上是可以互相转化的。 想到dfs也就常常会想到dp…

​Python—数据结构与算法​---动态规划—DP算法(Dynamic Programing)

我们一路奋战, 不是为了改变世界, 而是为了不让世界改变我们。 目录 我们一路奋战, 不是为了改变世界, 而是为了不让世界改变我们。 动态规划——DP算法(Dynamic Programing) 一、🏔斐波那契…

XDOJ(智慧平台)--分配宝藏(用动态规划dp算法解决)(C语言)

------------------------------------------------------------ 作为西电渣渣,这是我第一次接触需要一些很明确的算法的题目。 第一次博客写废话较多hhh,可以直接到下面看分析 我在昨天晚上和舍友一起肝这道题,肝了一个晚上都没有解决&…

dp算法篇Day1

"多希望有人来陪我,度过末日啊~" 讲讲我为什么突然想更新这篇栏目。 想想自己也算 "系统" 接触计算机这个学科也有差不多一年了,回想起当初下定决心要全身心投入到这个专业或者说行业中来,现在到了这样的地步&#xff0c…

第十四周DP算法总结

这周自己主要再看DP算法的博客,感觉DP这一部分内容确实比之前的都要麻烦一些,最后攻克这一部分难题还是挺好的。 这周自己总结了一些题型,以及一些方法思路,最后再把动态规划和之前的分治和贪心做一下比较。下面是详细的总结。 动…

DP算法(Dynamic Programming,俗称动态规划)是最经典算法之一

DP算法(Dynamic Programming,俗称动态规划)是最经典算法之一.本笔记以耳熟能详的数塔问题为引子,深入讨论01背包的解决方法. 首先,如下图所示,要求从顶层走到底层,若每一步只能走到相邻的结点,则经过的结点的数字之和最大是多少? 这个问题,对…

DP算法:动态规划算法

步骤 (1)确定初始状态 (2)确定转移矩阵,得到每个阶段的状态,由上一阶段推到出来 (3)确定边界条件。 例题 蓝桥杯——印章(python实现) 使用dp记录状态&#x…

动态规划(DP)算法初识

先用大白话来说一下几种经典算法大概的意思: 贪心算法:我就一次机会,为了达到目的,其他的我啥也不考虑回溯算法:我有无数次机会,还能怕我有达不到目的的时候?动态规划算法:我能随意…

常用十大算法_动态规划算法(DP)

动态规划算法(DP) 高能预警:DP算法不容易理解,需要动脑筋查资料找例题 动态规划算法(Dynamic Programming),是将复杂问题拆分成子问题,并在子问题的基础上,求解复杂问题…

动态规划算法(DP)

校招笔试面试前,大家一般都会先去牛客网上刷刷题,《剑指offer》,《leetcode》走起来,然后初次入手,发现很多不会,不会到什么程度呢,连个想法都没有,于是就去讨论区看答案,然后java大神,c++大神会给出花式解答,他们喜欢在答案前加一句,简单的dp算法,递归就可以解决…

【算法笔记】树形DP算法总结详解

0. 定义 树形DP,又称树状DP,即在树上进行的DP,是DP(动态规划)算法中较为复杂的一种。 1. 基础 令 f [ u ] f[u]~ f[u] 与树上顶点 u u u有关的某些数据,并按照拓扑序(从叶子节点向上到根节点…