机器学习基石笔记3——在何时可以使用机器学习（3）

3 Types of Learning
3.1 Learning with Different Output Space Y

从输出空间类型的角度分类机器学习的方法。

1. 二元分类（Binary Classification）：输出标签是离散的，二类的。

2. 多元分类（Multiclass Classification）：输出标签是离散的，多类的。二元分类是多元分类的特殊情况。

3. 回归（Regression）：输出是连续值。

4. 结构学习（Structured Learning）：输出是结构。结构学习和分类的区别是结构学习的输出没有明确的类别区分。

小结：

做道题：

解答：

3.2 Learning with Different Data Label yn

从数据标记的角度分类机器学习的方法。

1. 监督学习（Supervised Learning）：用有标记的数据训练假设。

2. 非监督学习（Unsupervised Learning）：用无标记的数据训练假设。

常见的例子：聚类、密度估计、异常检测等等。

3. 半监督学习（Semi-supervised Learning）：由于无标记数据量巨大、标记的成本较大等原因，训练假设的数据一部分（通常是少量的）是有标记的。

常见的例子：人脸识别、药效预测等等。

4. 强化学习（Reinforcement Learning）：训练假设的数据的标签是“隐式的”，通常无法直接表示什么是正确的。通俗地讲，就是输入数据到系统，如果系统的输出与预计的输出不符，“惩罚”系统；如果输出与预计接近，“奖励”系统，从而达到调整系统的目的，优化学习效果。

常见的例子：广告系统（通过用户是否点击广告来调节广告的展示：当前用户点击的广告是当前用户感兴趣的，那么下一次电脑就会多呈现类似主题的广告）等等。

小结：

做道题：

解答：

3.3 Learning with Different Protocol f ⇒ (xn, yn)

从学习策略的角度分类机器学习的方法。

1. 批量学习（Batch Learning）：样例一次性批量输入给学习算法，可以被形象的称为填鸭式学习，从而得到一个固定的假设。是最常见的机器学习策略。

2. 在线学习（Online Learning）：注意与批量学习的区别：在线学习的假设是不断根据样例进行调整的。

2.1 当前的假设被动地接受一个新样例，然后根据真实值与预测值来重新调整模型参数。

2.2 连续地进行2.1，直到所有的样例完成。及时不断地用样例去修正模型，进行优化。

例子：PLA和强化学习。

在邮件分类上批量学习和在线学习的区别：

3. 主动学习（Active Learning）：注意和在线学习的不同。半监督学习的一种。对于不确定的实例，学习算法可以主动询问当前实例的标记，得到反馈后，调整系统，继续学习。

上述3种学习策略的不同：

小结：

做道题：

解答：

3.4 Learning with Different Input Space X

从输入空间的角度分类机器学习的方法。

1. 具体特征（Concrete Features）：特征的每一维度都有实际具体的自然含义，经过人工提取，包含人类的智慧。

例子：

2. 原始特征（Raw Features）：特征的每一维只有简单的自然含义，需要机器或者人工转换成更具体的含义。

例子：识别手写体，输入只是图片中简单的像素矩阵。

3. 抽象特征（Abstract Features）：特征的每一维看似没有自然含义。需要进一步的特征转换、特征抽取和特征构造。

例子：各类评分系统（电影打分等等），给定用户和对象，得到该用户对该对象的打分情况。首先抽取出userid的特征，以及抽取每首歌曲itemid的特征，再用这些特征去学。

学习的难度由大到小：抽象特征>原始特征>具体特征。

原始特征、抽象特征都需要特征工程(Feature Engineering)的再处理。离散特征一般只需要简单选取。

小结：

做道题：

解答：

总结：

时间： 2024-12-24 06:35:33

机器学习基石笔记3——在何时可以使用机器学习（3）的相关文章

机器学习基石笔记4——在何时可以使用机器学习(4)

转载请注明出处:http://www.cnblogs.com/ymingjingr/p/4271742.html 目录机器学习基石笔记1——在何时可以使用机器学习(1) 机器学习基石笔记2——在何时可以使用机器学习(2) 机器学习基石笔记3——在何时可以使用机器学习(3)(修改版) 机器学习基石笔记4——在何时可以使用机器学习(4) 机器学习基石笔记5——为什么机器可以学习(1) 机器学习基石笔记6——为什么机器可以学习(2) 机器学习基石笔记7——为什么机器可以学习(3) 机器学习基石笔记8

机器学习基石笔记3——在何时可以使用机器学习(3)(修改版)

机器学习基石笔记1——在何时可以使用机器学习(1)

先简单介绍下这门课程,这门课是在著名的MOOC(Massive Online Open Course大型在线公开课)Coursera上的一门关于机器学习领域的课程,由国立台湾大学的年轻老师林轩田老师讲授.这门叫做机器学习基石的课程,共8周的课程为整个机器学习课程的上半部分,更偏重于理论和思想而非算法,主要分为四大部分来讲授. When can Machine Learn?在何时可以使用机器学习? Why can Machine Learn?为什么机器可以学习? How can Machine L

机器学习基石笔记2——在何时可以使用机器学习（2）

2 Learning to Answer Yes/No 2.1 Perceptron Hypothesis Set 根据信用卡问题引入PLA算法. 有以下特征: 抽象一下,成为特征向量x,根据x和权重的w的内积相对于阈值的大小决定输出标签的正负(正则赋予信用卡,负不赋予信用卡): 具体而言,感知机(perceptron)的假设空间如下: sign又叫sgn: 当x<0时,sign(x)=-1:当x=0时,sign(x)=0:当x>0时,sign(x)=1. 感知机的假设空间的向量形式:权重向量

机器学习基石笔记1——在何时可以使用机器学习（1）

1 The Learning Problem1.1 Course Introduction介绍课时设置. 1.2 What is Machine Learning 什么是机器学习? 类比人的学习:通过观察获得经验获得解决问题的技能. 机器的学习:通过大量数据获得经验(模型公式等)获得解决问题的技能(这些技能在是可以量化衡量,获得技能也就是在这些量化的指标上表现得有所提高). 机器学习的本质 Tom M. Mitchell对机器学习的定义:A computer program is said to

机器学习基石笔记2——在何时可以使用机器学习(2)

二.Learning to Answer Yes/No 二元分类. 解决上一章提出的银行发行信用卡的问题. 2.1 Perceptron Hypothesis Set 感知器的假设空间. 还是银行发信用卡的例子,银行可能掌握了用户的各种属性,如年龄,年薪,工作年限,负债情况等等,这些属性可以作为上面提到的样本输入的向量属性值.但是这样还是无法进行机器学习,因为我们还需要一个输入,假设空间H.假设空间该如何表示呢?本节提出了一种表示方式,这种算法的模型称之为感知器(Perceptron). 其实感

机器学习基石笔记3——在何时可以使用机器学习（3）

机器学习基石笔记3——在何时可以使用机器学习（3）的相关文章

机器学习基石笔记4——在何时可以使用机器学习(4)

机器学习基石笔记3——在何时可以使用机器学习(3)(修改版)

机器学习基石笔记1——在何时可以使用机器学习(1)

机器学习基石笔记2——在何时可以使用机器学习（2）

机器学习基石笔记1——在何时可以使用机器学习（1）

机器学习基石笔记2——在何时可以使用机器学习(2)

机器学习基石笔记6——为什么机器可以学习（2）

机器学习基石笔记15——机器可以怎样学得更好（3）

机器学习基石笔记9——机器可以怎样学习（1）