摘要
本文主要说明SVM中用到的超平面方程是怎么来的,以及各个符号的物理意义,怎么算空间上某点到该平面的距离。
正文
《 统计学习方法》一书给出如下说明:
首先说明我对超平面的理解:
在三维坐标系里,XoY平面把三维坐标系”分割”成两个空间,这个分割平面引申到一维,二维,四维空间…来,他就是一个超平面。一维里是一个点分割空间,二维里是条线,3维刚好是个平面,4维的用几何已经无法表示了,但是我们赋予这个分割的东西为超平面,就比较形象了。
对于这个分离超平面方程时怎么来的,书中如此解释:
这里的符号造成了一定的误解,w时向量还是矩阵,b是向量吗…
不失一般性,我们在二维里面推导这个方程和其物理意义,然后推广到多维空间。
符号说明:w (超平面的法向量<这里的法向量尚未归一化>,黑体,斜体),x(空间的任意向量,黑体,斜体),b(实数)。
下面来看法向量w的提出有什么意义:
对于x在这里可以看做由[0,0]到超平面任意‘点’的向量;
w法向量 的大小是[0,0]到分离超平面的距离,方向由分离超平面决定,或者说其方向决定了分离超平面,就像是先有鸡还是先有蛋的问题。
至此,我们论述了该方程确实可以表示一个二维空间里的超平面,推广到多维也是如此。接下来我们看下怎么计算空间里任一点A到该超平面的距离。
时间: 2024-12-28 11:47:17