Coursera公开课机器学习：Introduction

机器学习的定义

Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed.
Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learnfrom experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

如果一个计算机程序针对某类任务T的用P衡量的性能根据经验E来自我完善，那么我们称这个计算机程序在从经验E中学习，针对某类任务T，它的性能用P来衡量。

西洋跳棋学习问题：

任务T：下西洋跳棋
性能标准P：比赛中击败对手的百分比
训练经验E：和自己进行对弈

手写识别学习问题：

任务T：识别和分类图像中的手写文字
性能标准P：分类的正确率
训练经验E：已知分类的手写文字数据库

机器人驾驶学习问题：

任务T：通过视觉传感器在四车道高速公路上驾驶
性能标准P：平均无差错行驶里程（差错有人监督裁定）
训练经验E：注视人类驾驶时录制的一系列图像和驾驶指令

识别垃圾邮件

任务T：识别垃圾邮件
性能标准P：垃圾邮件识别率
训练经验E：已分类的邮件库

机器学习算法分类

主要是两大类：

有监督的：学习样本都分类好了
无监督的：学习样本不带类别信息

其它还有：强化学习，推荐系统等等。

有监督的机器学习算法

两大类：

回归：定量输出，或者说连续变量预测
分类：定性输出，或者说离散变量预测

举例来说：

根据面积预测房价就是回归：

根据肿瘤大小预测乳腺癌是良性的还是恶性的就是分类（毕竟只有两种可能，良性或者恶性）：

无监督的机器学习算法

无监督，简单而言就是不告诉计算机如何分类，直接输入数据，计算机自己进行分类。

所谓“一图抵千言”，直接看图可能效果更好些：

参考信息

本篇主要参考了以下资料：

Andrew Ng，Machine Learning
Coursera公开课笔记: 斯坦福大学机器学习第一课“引言(Introduction)”
Tom M.Mitchell著，曾华军、张银奎等译，《机器学习》，机械工业出版社，2003年1月
分类与回归区别是什么？

Coursera公开课机器学习：Introduction

时间： 2024-08-04 08:18:05

Coursera公开课机器学习：Introduction的相关文章

Coursera公开课机器学习：Linear Regression with multiple variables

多特征实际上我们真正买过房子的都知道,在选择房子的时候,需要考虑的不仅仅是面积,地段.结构.房龄.邻里关系之类的都应该是考虑对象,所以前面几讲谈论的,单纯用面积来谈房价,不免失之偏颇. 多考虑些特性我们加入一些特性来考虑房价问题: 符号解释 $n$:特性数目 $x ^{(i)}$:输入的第$i$个训练数据 $x ^{(i)} _j$:第$i$个训练数据的第$j$个特性 $h _\theta (x)$ 相应的,$h _\theta (x)$也就变了: $h _\theta (x) = \the

Coursera公开课机器学习：Linear Algebra Review（选修）

这节主要是回顾了下线性代数的一些简单知识. 矩阵与向量矩阵由$m\times n$个数$a _{ij}(i=1,2,...,m;j=1,2,...,n)$排成的$m$行$n$列的数表,称为$m$行$n$列的矩阵,简称$m\times n$矩阵,记作: $$ \matrix{A}= \begin{bmatrix} a _{11} & a _{12} & \cdots & a _{1n} \cr a _{21} & a _{22} & \cdots & a

Coursera公开课笔记: 斯坦福大学机器学习第七课“正则化”

Coursera公开课笔记: 斯坦福大学机器学习第七课"正则化" NLPJob 斯坦福大学机器学习第七课"正则化"学习笔记,本次课程主要包括4部分: 1) The Problem of Overfitting(过拟合问题) 2) Cost Function(成本函数) 3) Regularized Linear Regression(线性回归的正则化) 4) Regularized Logistic Regression(逻辑回归的正则化) 以下是每一部分的详细解读

Coursera公开课Functional Programming Principles in Scala习题解答：Week 2

引言 OK.时间很快又过去了一周,第一周有五一假期所以感觉时间绰绰有余,这周中间没有假期只能靠晚上加周末的时间来消化,其实还是有点紧张呢!后来发现每堂课的视频还有对应的课件(Slide).字幕(subtitles)可以下载,这样下载视频学习和在线学习就只差课程中间的Exercise了 Week 2主要讲函数,函数在Scala里是first-class citizen,可以在任意域内出现,这门课其实也是在借Scala来讲函数式编程原理.好了,不多说,进入习题解析. 这周的作业主要是使用函数来表示一

Coursera公开课Functional Programming Principles in Scala习题解答：Week 3

引言这周的作业其实有点复杂,需要完成的代码有点多,有点绕.本周的课程主要讲了Scala中的类.继承和多态,作业也很好的从各个方面考察了课程的内容.作业题目工程主要需要完成的部分是TweetSet.scala这个文件中的内容,比较新潮,都是和推特相关.其中定义了一个抽象类TweetSet,以及其的两个子类Empty.NonEmpty,表示空集和非空集.非空集使用二叉树来表示,二叉树的根是一个Tweet类对象,表示一条推特(用天朝的话来说叫做"微博"),一条微博哦不,一条推特包含user

Coursera公开课Functional Programming Principles in Scala习题解答：Week 1

引言工作之余参加了Coursera的公开课Functional Programming Principles in Scala,这个课是第三次开讲了,讲师仍然是Scala的祖师爷Martin Odersky先生.个人认为学习公开课最大的阻碍在于有些老师的口音实在是--不忍直视,比如最早在Coursera开授公开课的Andrew Ng(当然他现在是小老板了).幸好Martin大爷的英文口音不是很重,而且课程也不是很难,大家有兴趣可以去学习一下,地址在这里:https://class.course

Stanford公开课机器学习---1.Intrduction 机器学习介绍

文章是下面这个公开课的个人笔记,推荐的笔记里记的比较全,完全依据视频课程(有少量小错误),我的笔记依据课程按自己的理解记录一些重点,方便快速回顾.另外自己开始学这门课时搜到的好的资料,推荐给大家: |- Coursera上斯坦福大学Andrew Ng教授的"机器学习公开课" |-- 类别:适合入门 |-- 网页地址: https://www.coursera.org/learn/machine-learning/outline |-- 学习笔记:推荐 @小小人_V 同学这门课程的学习

neural networks and deep learning 吴恩达coursera公开课

课程链接:网易云课堂:http://study.163.com/my#/smarts ->free coursera:https://www.coursera.org/learn/neural-networks-deep-learning?authMode=signup ->need money 大牛学习笔记:https://zhuanlan.zhihu.com/p/29017066

斯坦福大学公开课机器学习：advice for applying machine learning - deciding what to try next（设计机器学习系统时，怎样确定最适合、最正确的方法）

假如我们在开发一个机器学习系统,想试着改进一个机器学习系统的性能,我们应该如何决定接下来应该选择哪条道路? 为了解释这一问题,以预测房价的学习例子.假如我们已经得到学习参数以后,要将我们的假设函数放到一组新的房屋样本上进行测试,这个时候我们会发现在预测房价时,产生了巨大的误差,现在我们的问题是要想改进这个算法接下来应该怎么办? 实际上我们可以想出很多种方法来改进算法的性能,其中一种办法是使用更多的训练样本.具体来讲,通过电话调查.上门调查,获取更多的不同的房屋出售数据.遗憾的是,好多人花费了大量