机器学习基石第三讲笔记

第三讲介绍了不同类型的机器学习问题,根据4个方面划分:输出空间,标签,方式,输入空间。

1. 根据输出空间y不同划分:通过变换y的种类,可得到不同的机器学习问题

  (1)y = {+1, -1}:二元分类问题,类似于做是非题,机器学习的基础。

  (2)y = {0, 1, 2, ..., k}:k元分类问题,类似于做单选题。

  (3)y = R:回归分析。

  (4)y = structures:structured learning,给定一段序列,判断序列的各个部分属于哪种结构。比如,输入一个句子,判断句子里每个词语的词性;输入一段蛋白质序列,判断序列各部分属于哪种结构域。

2. 根据所用标签不同划分:

  (1)supervised:所有输入的数据xn都有相应的标签yn,类似于老师给出了答案。

  (2)unsupervised:输入的数据没有标签,对应于clustering,类似于老师不给答案。

  (3)semi-supervised:只有部分数据有标签yn,当给所有数据标上标签所需代价很大时使用。

  (4)reinforcement:用goodness来提示标签,当没有明确的标签可以使用时使用。比如,一个广告系统根据客户以及广告的点击数来确定某个广告的好坏。

3. 根据所用学习方式不同划分:

  (1)batch learning:给机器一批已知的资料用于学习。

  (2)online learning:从不断接收到的一笔一笔资料中学习。比如,垃圾邮件过滤器。

  (3)active learning:从资料中提出xn,询问xn对应的yn,用于取得标签很贵的场合,用很少的标签就能完成学习。

4. 根据输入空间不同划分:从不同的input feature,找出最合适的,往往是机器学习成功的关键

  (1)Concrete features: each dimension of x represents ‘sophisticated physical meaning‘, often including ‘human intelligence‘ on the learning task。

  (2)Raw features: ‘simple physical meaning‘; thus more difficult for ML than concrete features; often need human or machines to convert to concrete ones。

  (3)Abstract features: ‘no physical meaning‘; thus even more difficult for ML。

时间: 2024-10-09 04:29:23

机器学习基石第三讲笔记的相关文章

机器学习基石第三讲:types of learning

博客已经迁移至Marcovaldo's blog (http://marcovaldong.github.io/) 刚刚完成机器学习基石的第三讲,这一讲主要介绍了机器学习的分类,对何种问题应该使用何种机器学习方法.将笔记整理在下面. Learning with Different Output Space 前面讲的信用卡发放问题是一个是非题,也就是说最后的输出只有两种,是一个二元分类(binary classification).下图中给出了更多的二元分类问题的例子,对于这类问题我们要做的就是找

机器学习基石第一讲笔记

近来觉得机器学习愈发重要.有人推荐了台大林轩田老师讲授的“机器学习基石”,感觉林老师讲得生动清楚,是很好的课程,值得一学. 第一讲介绍了机器学习是什么,使用机器学习的条件,机器学习的模型是怎样的. 1. 机器学习是一种处理复杂系统的方法,这里老师举了4个例子: (1) when human cannot program the system manually --navigating on Mars(2) when human cannot 'define the solution' easil

机器学习基石第五讲笔记

通过前四讲可知,在假设集大小(M)有限的条件下,机器是可以学习的.第五讲的目的是解决M为无限大时,机器是否能学习的问题. 为什么在假设集大小(M)有限的条件下,机器是可以学习的? 1. 其依据是Hoeffding不等式: 这个不等式说明了,训练集的错误率Ein(g)和测试集的错误率Eout(g)的差距太大(>ε)这件事情发生的概率是有上界的,这个上界由M.ε和N(样本量大小)决定. 这个不等式的由来是在第四讲之中.如果某份资料对于假设集的全体,至少存在一个假设g使得Ein(g)和Eout(g)的

机器学习基石第三讲 Types of Learning

一.Learning with Different Output Space Y 二.Learning with Different Data Label yn 监督式学习,每个训练样本都有对应的label,相当于每个x都有一个y对应 非监督式学习,每个训练样本是没有label的,需要电脑自己划分,类似于聚类,只有x而没有y 有些时候样本过于庞大,没法完全标签,只能对其中一部分标签,所以诞生了半监督式学习 增强式学习,很难明确的定义一个label,很难给x一个明确的y,比如21点,很难给要牌或者

机器学习基石第二讲笔记

第二讲介绍了Perceptron Learning Algorithm (PLA),是以后学习的基础. PLA是二元的线性分类器,类似于神经感受器,用于做是非题. 1. PLA的假设函数:h(x) = sign(w'x). 这里w'是列向量,x是行向量.x代表一个数据点,这个点可能包含了d个维度,即x = (x1, x2, ..., xd).举例来说,x可以是一个人,里面包含了人的各种特征,比如年龄.性别.职业.收入等等.w'是每个维度所占的权重.比如银行要给客户发信用卡,就要考虑客户各个方面以

机器学习基石笔记6——为什么机器可以学习(2)

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习基石笔记15——机器可以怎样学得更好(3)

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习基石笔记9——机器可以怎样学习(1)

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习基石笔记7——为什么机器可以学习(3)

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录 机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8