作者:Jason Gu
链接:https://www.zhihu.com/question/20466147/answer/28469993
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
SVM是通过超平面将样本分为两类。
在超平面确定的情况下,可以相对地表示点距离超平面的远近。对于两类分类问题,如果,则的类别被判定为1;否则判定为-1。
所以如果,则认为的分类结果是正确的,否则是错误的。且的值越大,分类结果的确信度越大。反之亦然。
所以样本点与超平面之间的函数间隔定义为
但是该定义存在问题:即和同时缩小或放大M倍后,超平面并没有变化,但是函数间隔却变化了。所以,需要将的大小固定,如,使得函数间隔固定。这时的间隔也就是几何间隔 。
几何间隔的定义如下
实际上,几何间隔就是点到超平面的距离。想像下中学学习的点到直线的距离公式
所以在二维空间中,几何间隔就是点到直线的距离。在三维及以上空间中,就是点到超平面的距离。而函数距离,就是上述距离公式中的分子,即未归一化的距离。
定义训练集到超平面的最小几何间隔是
SVM训练分类器的方法是寻找到超平面,使正负样本在超平面的两侧,且样本到超平面的几何间隔最大。
所以SVM可以表述为求解下列优化问题
以上内容在《统计学习方法》中,均有详细的讲解。
时间: 2024-10-20 15:21:27