SVM之超平面方程来源

摘要

本文主要说明SVM中用到的超平面方程是怎么来的,以及各个符号的物理意义,怎么算空间上某点到该平面的距离。

正文

《 统计学习方法》一书给出如下说明:

  

首先说明我对超平面的理解:

在三维坐标系里,XoY平面把三维坐标系”分割”成两个空间,这个分割平面引申到一维,二维,四维空间…来,他就是一个超平面。一维里是一个点分割空间,二维里是条线,3维刚好是个平面,4维的用几何已经无法表示了,但是我们赋予这个分割的东西为超平面,就比较形象了。

对于这个分离超平面方程时怎么来的,书中如此解释:

这里的符号造成了一定的误解,w时向量还是矩阵,b是向量吗…

不失一般性,我们在二维里面推导这个方程和其物理意义,然后推广到多维空间。

符号说明:w (超平面的法向量<这里的法向量尚未归一化>,黑体,斜体),x(空间的任意向量,黑体,斜体),b(实数)。

下面来看法向量w的提出有什么意义:

对于x在这里可以看做由[0,0]到超平面任意‘’的向量;

w法向量 的大小是[0,0]到分离超平面的距离,方向由分离超平面决定,或者说其方向决定了分离超平面,就像是先有鸡还是先有蛋的问题。

至此,我们论述了该方程确实可以表示一个二维空间里的超平面,推广到多维也是如此。接下来我们看下怎么计算空间里任一点A到该超平面的距离。

时间: 2024-12-28 11:47:17

SVM之超平面方程来源的相关文章

Python识别网站验证码

http://drops.wooyun.org/tips/6313 Python识别网站验证码 Manning · 2015/05/28 10:57 0x00 识别涉及技术 验证码识别涉及很多方面的内容.入手难度大,但是入手后,可拓展性又非常广泛,可玩性极强,成就感也很足. 验证码图像处理 验证码图像识别技术主要是操作图片内的像素点,通过对图片的像素点进行一系列的操作,最后输出验证码图像内的每个字符的文本矩阵. 读取图片 图片降噪 图片切割 图像文本输出 验证字符识别 验证码内的字符识别主要以机

基于支持向量机SVM的人脸识别

一.线性SVM 1. 背景: 1.1 最早是由 Vladimir N. Vapnik 和 Alexey Ya. Chervonenkis 在1963年提出 1.2 目前的版本(soft margin)是由Corinna Cortes 和 Vapnik在1993年提出,并在1995年发表 1.3 深度学习(2012)出现之前,SVM被认为机器学习中近十几年来最成功,表现最好的算法 2. 机器学习的一般框架: 训练集 => 提取特征向量 => 结合一定的算法(分类器:比如决策树,KNN)=>

SVM初学

一.            一点基础数学知识 现在硕士都快毕业了,反而将自己的许多数学知识忘的差不多了,所以,现在决心再捡起来,以补齐自己的数学短板,为以后的研究做好铺垫吧.现在结合自己学习SVM.MLC.ANN等机器学习方法来回顾以前的数学知识以及补充新的数学知识. 在SVM中,首先面临的问题是计算样本点到分类超平面的距离,现在就从最简单的点到直线的距离.点到平面的距离等内容开始回顾. 1)  点到直线的距离计算公式 假设直线L的方程为: 那么,点(x0,y0)到直线L的距离为d 如点(2,2

机器学习之&amp;&amp;SVM支持向量机入门:Maximum Margin Classifier

概率论只不过是把常识用数学公式表达了出来. --拉普拉斯 0. 前言 这是一篇SVM的入门笔记,来自我对PlusKid.JerryLead.July等大神文章的拜读心得,说是心得还不如说是读文笔记,希望在自己理解的层面上给予SVM这个伟大的机器学习算法概要介绍,让更多的热爱机器学习的伙伴们进入到SVM的世界.PS:文章会以问答的形式为主要结构. 1.概念 1.1.什么是SVM? 支持向量机即 Support Vector Machine,简称 SVM .(第一次接触SVM是在阿里大数据竞赛的时候

Spark机器学习系列之13: 支持向量机SVM

基本公式推导 理论部分:SVM涉及的理论知识太多太繁杂了,大家直接看: 支持向量机通俗导论(理解SVM的三层境界) http://blog.csdn.net/v_july_v/article/details/7624837 下面摘抄一小部分内容(不考虑推导细节的话,基本上能理解SVM方法推导的整个流程),对偶问题(包括KKT条件)在SVM起到很重要的作用,如果对此不很了解,则难以理解SVM推导过程.关于对偶分析,可以参考我的另一篇文章:http://blog.csdn.net/qq_345318

class-支持向量机SVM全析笔记

support vector machines,SVM是二类分类模型.定义在特征空间上间隔最大的线性分类器,由于包括核技巧实质上成为非线性分类器.学习策略是间隔最大化,可形式化为求解凸二次规划问题(convex quadratic programming).求解算法是求解凸二次规划的最优化算法. SVM学习方法分为线性可分支持向量机(linear support vector machine in linearly separable case).线性支持向量机(linear support v

深入理解SVM之对偶问题

我是搬运工:http://my.oschina.net/wangguolongnk/blog/111349 1. 支持向量机的目的是什么? 对于用于分类的支持向量机来说,给定一个包含正例和反例(正样本点和负样本点)的样本集合,支持向量机的目的是寻找一个超平面来对样本进行分割,把样本中的正例和反例用超平面分开,但是不是简单地分看,其原则是使正例和反例之间的间隔最大. 超平面是什么呢?简单地说,超平面就是平面中的直线在高维空间中的推广.那么,对于三维空间,超平面就是平面了.对于更高维的空间,我们只能

SVM及其对偶

引自 http://my.oschina.net/wangguolongnk/blog/111349 1. 支持向量机的目的是什么? 对于用于分类的支持向量机来说,给定一个包含正例和反例(正样本点和负样本点)的样本集合,支持向量机的目的是寻找一个超平面来对样本进行分割,把样本中的正例和反例用超平面分开,但是不是简单地分看,其原则是使正例和反例之间的间隔最大. 超平面是什么呢?简单地说,超平面就是平面中的直线在高维空间中的推广.那么,对于三维空间,超平面就是平面了.对于更高维的空间,我们只能用公式

再谈SVM

首先,是由逻辑回归引到SVM当中.先回顾一下逻辑回归的知识.其实主要是sigmoid的函数不要搞错. OK,既然是由逻辑回归引出来的,那么先列出逻辑回归的成本函数方程.然后对y为0和1分别进行画图讨论,形象化的图片如下.所以说,线性svm只是逻辑回归当中,h(x)是sigmoid的一种特例,这个不过分吧.因为它就是逻辑回归啊.只是h(x)变了下. 根据上文的画图后的代表,成本函数就转变成如下的形式. 貌似下面就能直接写出SVM的成本方程了.下面只是对前面的系数进行的一些简单的变化. 所以,以上就