学倦乱语

输入一个样本x,对样本x提取k个特征,根据这k个特征对x进行分类。
布隆过滤器:输入一个样本x,对x求k个哈希值,根据这k个哈希值对x进行分类:包含或者不包含。

机器学习中的样本集,必然是样本数远远大于类别数。
哈希,就是映射,就是函数。
函数就是在集合之间建立联系。
集合就是一个包含很多点的空间。
一切分类器最终都是若干个数字映射成若干个数字,终究是用数字描述的空间。
样本空间的容量必然大于类别空间的容量。
从样本空间到类别空间相当于压缩、哈希。

将N个布隆过滤器组合起来,就得到了一个神经网络一样的东西,它的输出有N个,这N个0、1值就可以表示类别的二进制表示。

对于包含N个类别的样本集,如果用one-hot方式,那就需要N个输出单元,如果使用二进制表示,那就可以只需要log2(N)个输出单元。
也可以训练log2N个神经网络,每个神经网络都输出一个值:0~1之间的数值。这样就越发像将若干个布隆过滤器拼起来了。

围棋、象棋关键也是一个分类器,即:将一个局面判为胜、负、和三种状态的分类器。棋的局面是天文数字,无法将这些样本集全部保存下来,但可以用另一种方式来“存储”这个样本集:函数。

描述事物的变化,就用到函数。
描述函数有两种方式:描点法,解析式法。
描点法需要大量的点,解析式法只要函数形式一固定,就只需要知道解析式的几个参数就够了。
所有的分类器都是固定的函数形式,它们学习的过程就是寻找参数的过程。
描点法在数据量小时比较直观。
解析式法给人以无限想象空间。
描点法是授人以鱼,解析式法是授人以渔。
给我一堆点,我只得到了这些点。给我一个解析式,我能够求出无数个点来。

描述简谐振动有两种方法:

  • 描述它的运动形式:y=sin(x)
  • 描述小球的受力形式:F=k*(dx)

描述事物的外在形式与描述事物的内在机理,二者一直都是描述事物的两种方式。
黑盒子与白盒子。把事物看做黑盒子,自己推断它的内部构造,这就是描点法。把事物看成白盒子,弄清原理,自然就可以推导出它的输出是怎样的。
这也是学习的两种方法。有的人不爱追求原理,甘当“调包侠”; 有的人追求底层,非看源码、懂原理心里才踏实。

时间: 2024-11-29 10:30:27

学倦乱语的相关文章

七日Python之路--无关Python(混人乱语,不看也罢)

2014年08月06日的下午,内心压制不住的狂躁抑或浮躁.莫名的感到很多无形的压力,以至于感觉自己似乎快要死去. 怎么说呢,前些日子情人节.自己鼓足勇气去见了自己内心喜欢的女生,当然她也是知道的.我们大二还是大三认识的,差不多有两年多了吧.大学不在一个学校,还有一个原因就是她那时有男朋友,但跟男朋友的时分时合.自己由于种种原因,跟她联系也不是太多.后来毕业,自己考研失败,当然这其中全是自己的问题,既然自己做出了选择便没有什么谈论后悔的资格.后来知道她考上了研究生.而我则在青岛找了一家小公司做起了

学各国语言的网站大全

东亚 1.汉语 ☆☆☆☆☆Chinese (Mandarin)汉语(普通话) http://www.csulb.edu/~txie/online.htm [网上学中文] http://www.chineseon.net [中文上网学习] http://www.chinawestexchange.com/Mandarin/ http://www.chinese-outpost.com/language/ [学中文:免费汉语普通话指南] http://www.chinese-tools.com/le

我最喜爱的宋词

临江仙 晏几道 梦后楼台高锁,酒醒帘幕低垂.去年春恨却来时,落花人独立,微雨燕双飞. 记得小苹初见,两重心字罗衣.琵琶弦上说相思,当年明月在,曾照彩云归. 苏轼 夜饮东坡醒复醉,归来仿佛三更.家童鼻息已雷鸣,敲门都不应,倚杖听江声. 长恨此身非我有,合适忘却营营.夜阑风静縠纹平,小舟曾此逝,江海寄余生. 晁冲之 忆昔西池池上饮,年年多少欢娱.别来不寄一行书,寻常相见了,犹道不如初. 安稳锦衾今夜梦,月明好渡江湖.相思休问定何如,情知春去后,管得落花无? 陈与义 忆昔午桥桥上饮,坐中多是豪英.长沟

确认偏误现象:谁都别想说服我

http://www.nowamagic.net/librarys/eight/posts/2477 如果你已经开始相信一个什么东西了,那么你就会主动寻找能够增强这种相信的信息,乃至不顾事实.这样一旦我们有了某种偏见,我们就无法改变主意了.比如说新闻业,给观众想要的东西,比给观众事实更实用.当人已经被各种观念分成了阵营,媒体追求的”客观中立”就显得无比苍白. 霍金写<时间简史>和<大设计>二书,都有一个被所有人忽视了的第二作者——列纳德·蒙洛迪诺.这两本书能够畅销,我怀疑霍金本人的

STL笔记(5)条款49:学习破解有关STL的编译器诊断信息

STL笔记(5)条款49:学习破解有关STL的编译器诊断信息 条款49:学习破解有关STL的编译器诊断信息 用一个特定的大小定义一个vector是完全合法的, vector<int> v(10);    // 建立一个大小为10的vector 而string在很多方面像vector,所以你可能希望可以这么做: string s(10);        // 常识建立一个大小为10的string 这不能编译.string没有带有一个int实参的构造函数.我的一个STL平台像这样告诉我那一点: e

软考之路(四)---软件project一 概念模型,逻辑模型,物理模型

自从接触到数据库到如今这三个概念大家理解的还有些不清楚,今天来为大家解答疑惑,共同提高,结合生活理解 概念模型        概念模型就是在了解了用户的需求,用户的业务领域工作情况以后,经过分析和总结,提炼出来的用以描写叙述用户业务需求的一些概念的东西.如销售业务中的"客户"和"定单",还有就是"商品","业务员". 用USE  CASE(用例图)来描写叙述就是:"业务员"与"客户"就购

小谈学习方法(学习篇)

读了这么多年的书,虽没有特别的成就,但也该多总结自己的学习方法吧.这里谈的学习方法,主要还是指理科方面,不拘束于哪个年龄阶段.当然,在学习方法方面,是因人而异的,不是说我的方法就适合你,同时我也不是什么大牛或者学霸,纯属自己的一些学习心得,希望可以和大家多多交流. 首先,先说说智商的话题吧,不知道你想不相信智商,但我相信很多人都是相信的,包括我,也是相信智商压制的.智商这东西是存在的,不然还要科学家干什么对吧?举个例子,即使把一亿人关在小屋子想100年,也是想不出爱因斯坦的相对论的,也造不出原子

一个java程序员自学IOS开发之路(一)

首先自我介绍吧,南昌大学软件工程专业2015界毕业生,从大学牲变到程序猿,由于在学校里只学了Java语言和B/S架构开发,于是乎出来实习和工作也是搞Java网页开发. 但是作为一名果粉,现阶段想转IOS开发,最近也开始自学了,写点东西记下来吧 2015/9/17 Day 1 安装虚拟机并安装Mac OS X系统(苦逼的我还在用联想Y-470) 开始看C语言基础,由于大学里学过一点,还是比较轻松的 2015/9/19 Day 2 由于Java中没有指针,开始看指针的相关知识 2015/9/20 D

2014年 总结

一年里充满了意外,先是高考以最差成绩结束中学生活,离开了一些老同学:后是误打误撞进入了烟台大学学习计算机,并且认识这些让我心情舒畅的舍友.同学. 想起今年5月曾经在毕老师家里讨论高考时那个自信满满的我,真是连我自己都哭笑不得.毕老师问我要考什么学校,我说没想好至少也是211吧.结果却是在理综考试中出现了意外,刚够一本线.考完试后,心情差到了极点,好长时间才平复过来.用我妈的话讲就是,在床上躺了半个月.现在回想查成绩时在爸爸妈妈面前哭成林黛玉真的有点不妥,他们肯定比我更失望,自己太不懂事了.之后好