机器学习笔记(第六章支持向量机)

猪里程

2024-05-08 帮助1人

机器学习（周志华著） Datawhale打卡第四天

第六章支持向量机

基本

为什么使用支持向量

对于给定训练集 $D=\{(x_1,y_1),...,(x_m,y_m)\},y\in\{-1, 1\}$ 二分类问题，之前的线性回归的思想是在样本空间找到一个划分超平面，但如下图所示，将样本划分的超平面可能有很多，我们如何得知哪个超平面是最佳的呢。

学新通

直观上看，两堆样本的“正中间”的划分超平面，对样本局部扰动的“容忍”性最好。例如，当训练集由于局限性或者噪声的因素而产生一些接近分隔平面的样本点时，其他划分平面会更容易出现错误，而最中间的超平面受影响最小，即“鲁棒”性最好，如何找到这个超平面，就是支持向量机的任务。

支持向量

样本空间中，划分超平面用如下方程描述：
$w^Tx b=0\\ 其中w=\{w_1,w_2,...,w_d\}为法向量,b为位移项$
样本中任意点到超平面的距离 $r=\frac{|w^Tx b|}{||w||}$ ,由于这个公式比较重要，下面来证明
$证：设任意一点为x_0=(x_1^0,x_2^0,...,x_n^0)^T\\ 其在超平面上的投影点为x_1=(x_1^1,x_2^1,...,x_n^1)^T\\ 有w^Tx_1 b=0,且有\vec{x_1x_0}与法向量w平行\\ 因此|w.\vec{x_1x_0}|=||w||.||\vec{x_1x_0}||=||w||.r\\ \begin{aligned} w.\vec{x_1x_0}&=w_1(x_1^0-x_1^1) ...w_n(x_n^0-x_n^1)\\ &=w^Tx_0-w^Tx_1\\ &=w^Tx_0 b \end{aligned} \\ 即r_{x_0}=\frac{|w^Tx_0 b|}{||w||}$

假设超平面 $(w, b)$ 能将样本正确分类，对于二分类的正样本 $y_i= 1$ ,与负样本 $y_i=-1$ ,其应该满足：
$\begin{cases} & w^Tx_i b\ge 1 ,y_i= 1\\ & w^Tx_i b\le -1,y_i= 1 \end{cases}$
其中，存在缩放变换 $\varsigma w\longmapsto w'\text和\varsigma b\longmapsto b'$ ，使得距离超平面最近的几个样本点，可使上式等号成立，如图所示，

学新通

这些使等号成立的向量被称为“支持向量”。

它们到超平面的距离之和为 $\gamma=\frac{2}{||w||}$ ，称为“间隔”。

支持向量的任务便转化为寻找“最大间隔”的划分超平面，即找到合适的 $w, b$ ，使得
$\max_{w,b}\frac{2}{||w||} \\ s.t. \ y_i(w^Tx_i b)\ge 1,\ i=1,2...,m$
而最大化 $w||^{-1}$ 等价于最小化 $w||^2$ ，于是上式可重写为
$\min_{w,b}\frac{1}{2}||w||^2\\ s.t. \ y_i(w^Tx_i b)\ge 1,\ i=1,2...,m$
这就是支持向量机(Support Vector Machine,SVM)的基本型。

对偶问题

基本型可以直接用现成的优化方法求解，但是求解其对偶问题更为高效。

对基本型使用拉格朗日乘子法可得到其“对偶问题”

$L(w,b,\alpha)=\frac{1}{2}||w||^2 \sum_{i=1}^{m}\alpha_i (1-y_i(w^Tx_i b))\\ 令\frac{\partial L}{\partial w}=0,\frac{\partial L}{\partial b}=0\\ 得w=\sum_{i=1}^{m}\alpha_iy_ix_i\\ 0=\sum_{i=1}^{m}\alpha_iy_i\\$
代入得对偶问题
$\max_{\alpha}\sum_{i=1}^{m}\alpha_i-\frac{1}{2}\sum_{i=1}^{m}\sum_{j=1}^{m}\alpha_i\alpha_jy_iy_jx_i^Tx_j\\ s.t. \ \sum_{i=1}^{m}\alpha_iy_i=0,\\ \alpha_i\ge0,\ i=1,2,...,m\\$
以及KKT条件
$\begin{cases} & \alpha _i\ge 0 \\ & y_if(x_i)-1\ge 0\\ & \alpha _i(y_if(x_i)-1)=0 \end{cases}$

算法的求解比较复杂，后面再写。。。

未完待续。。。

这篇好文章是转载于：学新通技术网

机器学习笔记(第六章支持向量机)

机器学习（周志华著） Datawhale打卡第四天

第六章支持向量机

基本

photoshop保存的图片太大微信发不了怎么办

《学习通》视频自动暂停处理方法

word里面弄一个表格后上面的标题会跑到下面怎么办

Android 11 保存文件到外部存储，并分享文件

photoshop扩展功能面板显示灰色怎么办

微信公众号没有声音提示怎么办

excel下划线不显示怎么办

excel打印预览压线压字怎么办

TikTok加速器哪个好免费的TK加速器推荐

怎样阻止微信小程序自动打开

机器学习笔记(第六章支持向量机)

机器学习（周志华著） Datawhale打卡第四天

第六章 支持向量机

基本

photoshop保存的图片太大微信发不了怎么办

《学习通》视频自动暂停处理方法

word里面弄一个表格后上面的标题会跑到下面怎么办

Android 11 保存文件到外部存储，并分享文件

photoshop扩展功能面板显示灰色怎么办

微信公众号没有声音提示怎么办

excel下划线不显示怎么办

excel打印预览压线压字怎么办

TikTok加速器哪个好免费的TK加速器推荐

怎样阻止微信小程序自动打开

第六章支持向量机