Stanford公开课机器学习---1.Intrduction 机器学习介绍

文章是下面这个公开课的个人笔记,推荐的笔记里记的比较全,完全依据视频课程(有少量小错误),我的笔记依据课程按自己的理解记录一些重点,方便快速回顾。另外自己开始学这门课时搜到的好的资料,推荐给大家:

|— Coursera上斯坦福大学Andrew Ng教授的“机器学习公开课”

|—- 类 别:适合入门

|—- 网页地址: https://www.coursera.org/learn/machine-learning/outline

|—- 学习笔记:推荐 @小小人_V 同学这门课程的学习笔记:http://vdisk.weibo.com/s/J4rRX/1373287206

|—- 网盘地址(全视频版和字幕,ppt和笔记):

百度云分享: http://pan.baidu.com/s/1i31QDTF 密码: 1a36

360云盘分享:http://yunpan.cn/cJYpBDKUqrzNR (提取码:6e99)


1 机器学习介绍


1.1 什么是机器学习?

机器学习:研究的是如何赋予计算机在没有被明确编程的情况下仍能够学习的能力。 Machine learning is the field of study that gives computers the ability to learn without being explicitly programmed.


机器学习:对于某个任务 T 和表现的衡量 P,当计算机程序在该任务 T 的表现上,经过 P 的衡量, 随着经验 E 而增长,我们便称计算机程序能够通过经验 E 来学习该任务。Computer program is said to learn from experience E with respect to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.

(在跳棋游戏的例子中,任务 T 是玩跳棋游戏,P 是游戏的输赢,E 则是一局又一局的游戏。)

机器学习的应用举例:

  1. ???? 数据库挖掘
  2. 一些无法通过手动编程来编写的应用:如自然语言处理,计算机视觉
  3. 一些自助式的程序:如推荐系统
  4. 理解人类是如何学习的

1.2 监督学习(Supervised Learning)

监督学习:已有的样本已知要预测的变量。用已知来预测未知。

回归问题(Regression):预测的结果是连续地值。例如:预测房价

分类问题(Classification):预测的结果是离散有限的分类,能够学会如何将数据分类到不同的类里。例如:预测是否是恶性肿瘤


1.3 非监督学习(Unsupervised Learning)


非监督学习:现有数据中并没有结果,我们有的只是特征,因而非监督学习要解决的问题是发现这些数据是否可以分为不同的组。

在未知的数据中,依据数据特征,对数据分组。

聚类问题(Clustering):在未知的数据中,依据数据特征,对数据分组。

例子:

  • 对一个大型的数据中心的网络传输数 据情况进行分析,发现那些多数时候是在协作的计算机。
  • 根据是否具有某些基因而将这些人聚类
  • 市场分类
  • 鸡尾酒会问题:房间中有多个人在同时在讲话,利用多个麦克风来录音,分离出每个人的讲话。只有一行的机器学习算法(Octave)可以非常漂亮地将两个人的说话给分离开来:

    ?[W,s,v]=svd((repmat(sum(x.?x,1),size(x,1),1).?x)?x′);


1.4 测试

时间: 2024-11-09 01:46:23

Stanford公开课机器学习---1.Intrduction 机器学习介绍的相关文章

斯坦福机器学习公开课学习笔记(1)—机器学习的动机与应用

(转载请注明出处:http://blog.csdn.net/buptgshengod) 1.背景 斯坦福机器学习公开课差不多是网上能找到的最好的机器学习入门课程了.现在一共有20节课放到网络上,博主是在网易公开课学的,那里的视频有中文字幕然后课件也很全. (地址:http://v.163.com/special/opencourse/machinelearning.html) 主讲师Andrew Ng(已经被百度诏安了)是华裔科学家,看他的课特别有亲切感.感觉他们的课跟国内老师的课区别还是挺大的

Coursera公开课笔记: 斯坦福大学机器学习第七课“正则化”

Coursera公开课笔记: 斯坦福大学机器学习第七课"正则化" NLPJob 斯坦福大学机器学习第七课"正则化"学习笔记,本次课程主要包括4部分: 1) The Problem of Overfitting(过拟合问题) 2) Cost Function(成本函数) 3) Regularized Linear Regression(线性回归的正则化) 4) Regularized Logistic Regression(逻辑回归的正则化) 以下是每一部分的详细解读

Stanford公开课机器学习---2.单变量线性回归(Linear Regression with One Variable)

单变量线性回归(Linear Regression with One Variable) 2.1 模型表达(Model Representation) m 代表训练集中实例的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 (x,y) 代表训练集中的实例 (x(i),y(i) ) 代表第 i 个观察实例 h 代表学习算法的解决方案或函数也称为假设(hypothesis) 单变量线性回归:只含有一个特征/输入变量 x hθ=θ0+θ1x 2.2 代价函数(Cost Function) 目标

Stanford公开课机器学习---4.Matlab/Octave 快速教程

Basic Operations 基本操作 a = 1.0000 15.0000 2.0000 0.5000 % ================format ================ >> format long >> a a = 1.000000000000000 15.000000000000000 2.000000000000000 0.500000000000000 % ================fprintf ================ >&g

Stanford公开课机器学习---3.多变量线性回归 (Linear Regression with multiple variable)

3.多变量线性回归 (Linear Regression with multiple variable) 3.1 多维特征(Multiple Features) n 代表特征的数量 x(i)代表第 i 个训练实例,是特征矩阵中的第 i 行,是一个向量(vector). x(i)j代表特征矩阵中第 i 行的第 j 个特征,也就是第 i 个训练实例的第 j 个特征. 多维线性方程: hθ=θ0+θ1x+θ2x+...+θnx 这个公式中有 n+1 个参数和 n 个变量,为了使得公式能够简化一些,引入

Coursera公开课机器学习:Linear Regression with multiple variables

多特征 实际上我们真正买过房子的都知道,在选择房子的时候,需要考虑的不仅仅是面积,地段.结构.房龄.邻里关系之类的都应该是考虑对象,所以前面几讲谈论的,单纯用面积来谈房价,不免失之偏颇. 多考虑些特性 我们加入一些特性来考虑房价问题: 符号解释 $n$:特性数目 $x ^{(i)}$:输入的第$i$个训练数据 $x ^{(i)} _j$:第$i$个训练数据的第$j$个特性 $h _\theta (x)$ 相应的,$h _\theta (x)$也就变了: $h _\theta (x) = \the

Coursera公开课机器学习:Introduction

机器学习的定义 Arthur Samuel (1959). Machine Learning: Field of study that gives computers the ability to learn without being explicitly programmed. Tom Mitchell (1998) Well-posed Learning Problem: A computer program is said to learnfrom experience E with r

CSDN在线公开课日历【七月】

为方便广大学员了解并参与CSDN线上公开课,特将CSDN全部线上公开课进行整理汇总,每月进行不定期更新.学员可通过点击"报名详情"了解课程内容设置,进行报名参与.通过点击"课程回顾"链接,观看每期公开课视频. 七月公开课日历 时间 主题 讲师介绍 报名详情 课程回顾 07.31 20:00-21:00 iOS App研发的最后冲刺:内测与部署 纪承(fir.im 开发组长) 报名详情 课程回顾 07.30 19:30-21:30 测试神器QuickTest参数的应用

斯坦福机器学习公开课---1.机器学习简单介绍

斯坦福机器学习公开课---1. 机器学习简单介绍 1.1  介绍 机器学习流行原因--- 1)      由人工智能AI发展来的一个领域 2)      是计算机需要开发的一项新的能力,涉及工业和基础学科中的很多内容. 应用学习算法,如设计自主机器人,计算生物学和其他被机器学习影响的领域. 1.2  机器学习应用 1)        数据挖掘 网站点击流数据.电子医疗记录.计算生物学和工程学. 2)        无法手动进行编程的领域 自动直升机.手写体识别.自然语言处理NLP和计算机视觉.