机器学习:
- 研究的是计算机怎么模拟人类的学习行为,以获取新的知识和技能,
- 并重新组织已有的知识结构使之不断改善自身。
- 简单一点说:就是计算机从数据(样本,实例)和一定的学习算法中学习出
- 规律和模式,以应用在新数据上做预测的任务
今日头条:用机器学习挖掘个体用户感兴趣的新闻
表情检测
alphaGo 人机大战
学习 = 在某项任务上总结与积攒经验
1.在任务T上提升
2.用P作为评估标准
3.基于经验E
例子:中国象棋
1.任务T:下中国象棋
2.性能目标P:比赛中击败对手(的百分比)
3.训练经验E:计算机和计算机自己进行对弈,或者看棋谱学习
机器学习与人工智能:机器学习是一个人工智能的一个分支,也可以说是一个人工智能的一个实现方式。
思考?
如何设计无人驾驶机动车?
传统的方式:提前熟悉每条路况,提前告诉计算机,哪里去哪里怎么走。 这很复杂
无法处理突发事件
机器学习方式:设计一套机制,给一些初始数据,让它试着开一开
效果好,就再接再厉。效果不好,就改正
自己去学习,自己反馈
增强式学习
有摄像头识别路况,图像识别
机器学习算法分类:
监督学习:(分类预测,回归分析)例如用户点击/购买预测,房价预测 告诉了样本当前样本的结果
无监督学习:(聚类,关联规则)例如邮件/新闻聚类 提前不知道有多少类,按标题特征聚类
强化学习:(Q-learning,时间差学习)例如动态系统以及机器人控制
监督学习:样本中告诉了结果
监督学习算法:训练/学习(样本带有结果)-》预测(去预测结果)
无监督学习:样本无target
把特征相近的样本放在一堆
自己探索和发现
增强式学习/RL:行为认知发下的机器学习分支
Agent感知环境,做出动作,根据奖惩状态feedback做出调整和悬着
连续值(continuous):按数据的input和output 比如房价 200万 205万 206.5万。
离散(Categorical): 按数据的input和output 邮件分类,正常邮件,垃圾邮件,结果只有两个值
如何选取适合样本的机器学习算法?