神经网络从被人忽悠到忽悠人(五)

前面一节讲过,Vladimir Vapnik的出现,在神经网络的发展过程中起到了很关键的作用,而这种所谓的作用就是挑战。Vladimir Vapnik到底提出了什么理论能有这么大的影响呢?大家都非常熟悉的分类方法:支持向量机(SVM)

Vladimir Vapnik

支持向量机(SVM)

Vapnik等人在多年研究统计学习理论基础上对线性分类器提出了另一种设计最佳准则。其原理也从线性可分说起,然后扩展到线性不可分的情况。甚至扩展到使用非线性函数中去,这种分类器被称为支持向量机(Support Vector Machine,简称SVM)。支持向量机的提出有很深的理论背景。换句话说,SVM的理论基础不是那么的好理解的。

SVM主要是针对线性可分情况进行分析,对于线性不可分的情况,通过使用非线性映射算法将低维输入空间线性不可分的样本转化为高维特征空间使其线性可分,从而使得高维特征空间采用线性算法对样本的非线性特征进行线性分析成为可能;以前讲升高维度处理问题,现在讲降维攻击。

函数间隔(functional margin)和几何间隔(geometric margin)

从下图可以看出,把x和o分开来,有非常多的直线能够把它区分出来,那什么样的直线是最优的呢?最优的过程可以取函数间距过程,每个样本到直线的垂直距离和他的分类乘积最大为最优,距离自带方向,分类也带正负,因此函数间隔代表了我们认为特征是正例还是反例的确信度。一条直线的标识方式有多种(参数的倍数也能代表同一条直线),这样就带来参数的多样性,需要采用归一化解决。

通过推到可以得到:

全局的几何间隔:

最优间隔分类器(optimal margin classifier)

回想前面我们提到我们的目标是寻找一个超平面,使得离超平面比较近的点能有更大的间距。也就是我们不考虑所有的点都必须远离超平面,我们关心求得的超平面能够让所有点中离它最近的点具有最大间距。形象的说,我们将上面的图看作是一张纸,我们要找一条折线,按照这条折线折叠后,离折线最近的点的间距比其他折线都要大。形式化表示为:

这下好了,只有线性约束了,而且是个典型的二次规划问题(目标函数是自变量的二次函数),处理二次规划问题有现成的方法,但需要较好的数学处理能力。求出w,b就能寻找到超平面,通过寻找一个线性的超平面来达到对数据进行分类的目的。不过,由于是线性方法,所以对非线性的数据就没有办法处理了,核函数能处理非线性的情况。

核函数(Kernels)

图中的两类数据,分别分布为两个圆圈的形状,不论是任何高级的分类器,只要它是线性的,就没法处理,SVM 也不行。因为这样的数据本身就是线性不可分的。

SVM 处理这种分类的方法,是把他们先投影到两外一个坐标下,再采用之前线性的方法进行处理。

对于非线性的情况,SVM 的处理方法是选择一个核函数,通过将数据映射到高维空间,来解决在原始空间中线性不可分的问题。由于核函数的优良品质,这样的非线性扩展在计算量上并没有比原来复杂多少,这一点是非常难得的。当然,这要归功于核方法——除了 SVM 之外,任何将计算表示为数据点的内积的方法,都可以使用核方法进行非线性扩展。

svm方法有很强数学理论基础,svm的方法被大量的使用在图片识别,语音识别上,都取到了很好的效果。成为了90年代到现在较为流行的算法。

90年代,在贝尔实验室里,Yann Lecun和 Vapnik 常常就 神经网络和 SVM 两种技术的优缺点,常常讨论得非常的深入,慢慢的形成了svm方法的支持者和神经网络的信徒。

Scholkopf是Vapnik的大弟子,支持向量机与核方法研究的领军人物。据Scholkopf说,Vapnik当初发明支持向量机就是想’干掉’神经网络(He wanted to kill Neural Network)。支持向量机确实很有效,一段时间支持向量机一派占了上风。

很多人都认为svm是两成的神经网络。
近年来,神经网络一派的大师Hinton又提出了神经网络的Deep Learning算法,使神经网络的能力大大提高,可与支持向量机一比。Deep Learning假设神经网络是多层的,首先用Restricted Boltzmann Machine学习网络的结构,然后再通过Back Propagation学习网络的权值。关于Deep Learning的命名,Hinton曾开玩笑地说: I want to call SVM shallow learning. (注:shallow 有肤浅的意思)。其实Deep Learning本身的意思是深层学习,因为它假设神经网络有多层。

from: http://datartisan.com/article/detail/122.html

时间: 2024-10-13 00:20:01

神经网络从被人忽悠到忽悠人(五)的相关文章

人的烦恼来自人的欲望,人的欲望来自人的能力

人的烦恼来自人的欲望,人的欲望来自人的能力. 能力越强,欲望越大,欲望越大,则烦恼越多. 所以,欲望少一分,则烦恼少一分,快乐便多一分. 也许正如<庄子·列御寇>中所说,“巧者劳而知者忧,无能者无所求.饱食而遨游,泛若不系之舟,虚而遨游者也”. 还有一首诗: 铁甲将军夜渡关, 朝臣待漏五更寒. 山寺日高僧未起, 算来名利不如闲. 表达的大概也是这个意思吧.

技术开发工程师 创业.工作近2年,3万注册公司,两人,一人一万五。

韩梦飞沙  韩亚飞  [email protected]  yue31313  han_meng_fei_sha 创业.工作近2年,3万注册公司,两人,一人一万五. I have worked for nearly two years, 30,000 registered companies, two people, one thousand five. 作者:韩梦飞沙 Author:han_meng_fei_sha 邮箱:[email protected] E-mail: 313134555

神经网络从被人忽悠到忽悠人(一)

为何取这标题呢,只是觉得目前人工智能只用于娱乐而已. 很早的时候就想写几篇关于人工智能的东西,把人工智能的东西写的通俗易懂点,但是毕竟人工智能的东西涉及的领域太广了,特别是对数学和概率有比较深的理解,如果只是想简单的了解,可以跳过文章的公式. 很难想象有什么事物会像廉价.强大.无处不在的人工智能那样拥有“改变一切”的力量.<必然> 前段时间的AlphaGo再次的把人工智能炒的火热,关于人工智能的讨论又再次进入讨论的风口浪尖上.各个方面对AlphaGo技术的猜测,神经网络也再次成为了技术的焦点.

神经网络从被人忽悠到忽悠人(二)

引子 Minsky说过神经网络无法解决异或问题.60年代关于神经网络的研究还取得了一定的进展,但是都没有取得重大的突破.70年代,神经网络的研究进入了萧条期,人工智能里产生了许多不同的方向,神经网络,好像被人们所忘记. 直到1986年,David Rumelhar和Geoffery Hinton等人提出了反向传播(Backpropagation,BP)算法,解决了两层神经网络所需要的复杂计算量问题,克服了Minsky说过神经网络无法解决异或问题,该算法是对神经网络受到批判的一个有力的回答. 其中

神经网络从被人忽悠到忽悠人(三)

引子 在上一章,讲过bp神经网络虽然取得了很大的进步,但它本身存在着一些无法避免的问题,其中一个比较困惑的应该是局部最优解问题. 只接触那些你已经喜欢的东西是有风险的,即你可能会卷入一个以自我为中心的漩涡,从而对任何与你的标准存在细微差异的事情都视而不见,即使你原本会喜欢它.这种现象被称为“过滤器泡沫”(filter bubble),技术术语是“过适”(overfitting). — 必然 所谓的局部最优解的问题就是:卡在一个小高点的位置,而却认为自己在最高点,导致训练提前结束. 很多优化的算法

除皮卡丘让人疯狂、让人晕外,任天堂还干过的晕眩囧事

如果有一款超有趣的游戏机,但只能玩15分钟,你会喜欢吗? 文/张书乐 原载于<人民邮电报>2016年8月12日<乐游记>专栏114期 在手机游戏<口袋妖怪Go>大获成功的一片赞美声中,人们似乎看到了AR和VR未来在娱乐和商业领域无可限量的前景.但事物总具有两面性,接下来,我们真的要"黑"一下奇迹创造者任天堂. 比其他游戏巨头更具有创新"基因"的任天堂,总是在"黑科技"的九死一生中跌宕起伏.先谈一件往事,依然和口

同步函数 生产者和消费者模式 加强版(多人生产和多人消费)

曾经搞了半天, 生产者和消费者模式  加强版(多人生产 多人消费 ).. 以前的代码格式就不再吐槽了(以后努力改进) //输出结果是一个无限循环 import java.util.concurrent.locks.Condition; import java.util.concurrent.locks.Lock; import java.util.concurrent.locks.ReentrantLock; /** * 多个生产者&多个消费者模式 * 多个生产者不断生产,多个消费者不停的消费

人件札记:人血馒头

前言:相信鲁迅先生的<人血馒头>无人不知,血馒头可以拯救一个要死的命.大家都知道,这是个骗局. 来一个好的架构师,然后项目谁走谁留都无所谓 这是今天上级给我的建议,说他的朋友给他提过这样的想法:让一个牛逼的架构师架构好项目,然后找一些大学生填填代码,项目就完成了,谁走了,下一个谁就可以立马上任,这样就OK了. 这又是一个神话,很多有"理想"的人都喜欢编织这样的"巴比伦",简直在他们看来,这就是个解决问题的完美解决方案. 我不知道提出这样观点的人,是否真正

印度北方邦一发电厂爆炸 致9人死亡100余人受伤hh

生活中有这样的现象,主要领导者利用制度漏洞,把个人意志强加于集体,集体决策成为变相的个人决策,当然要由个人负责"张军向记者描述,现场已经有很多群众被砍伤,如果不果断处置,这伙暴徒还可能继续伤及更多无辜群众,造成更大伤亡.特别之处在于,用户在使用的时候不需要检索确切的歌手.曲名,其倾向于引导引导用户使用自然语言搜索,然后为用户推荐音乐.公司秉承中国农业文明传统,致力于中国现代农业装备的推广与应用.但如果不在店里上保险,就没有20万的优惠了.好在事情比较顺利,比对了100多条信息后,小女孩在宁波的户