机器学习的定义
- Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
- Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learnfrom experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
如果一个计算机程序针对某类任务T的用P衡量的性能根据经验E来自我完善,那么我们称这个计算机程序在从经验E中学习,针对某类任务T,它的性能用P来衡量。
西洋跳棋学习问题:
- 任务T:下西洋跳棋
- 性能标准P:比赛中击败对手的百分比
- 训练经验E:和自己进行对弈
手写识别学习问题:
- 任务T:识别和分类图像中的手写文字
- 性能标准P:分类的正确率
- 训练经验E:已知分类的手写文字数据库
机器人驾驶学习问题:
- 任务T:通过视觉传感器在四车道高速公路上驾驶
- 性能标准P:平均无差错行驶里程(差错有人监督裁定)
- 训练经验E:注视人类驾驶时录制的一系列图像和驾驶指令
识别垃圾邮件
- 任务T:识别垃圾邮件
- 性能标准P:垃圾邮件识别率
- 训练经验E:已分类的邮件库
机器学习算法分类
主要是两大类:
- 有监督的:学习样本都分类好了
- 无监督的:学习样本不带类别信息
其它还有:强化学习,推荐系统等等。
有监督的机器学习算法
两大类:
- 回归:定量输出,或者说连续变量预测
- 分类:定性输出,或者说离散变量预测
举例来说:
根据面积预测房价就是回归:
根据肿瘤大小预测乳腺癌是良性的还是恶性的就是分类(毕竟只有两种可能,良性或者恶性):
无监督的机器学习算法
无监督,简单而言就是不告诉计算机如何分类,直接输入数据,计算机自己进行分类。
所谓“一图抵千言”,直接看图可能效果更好些:
参考信息
本篇主要参考了以下资料:
- Andrew Ng,Machine Learning
- Coursera公开课笔记: 斯坦福大学机器学习第一课“引言(Introduction)”
- Tom M.Mitchell著,曾华军、张银奎等译,《机器学习》,机械工业出版社,2003年1月
- 分类与回归区别是什么?
Coursera公开课机器学习:Introduction
时间: 2024-08-04 08:18:05