CS229：监督学习

定义符号

m:训练样本的数目

n：特征的数量

x‘s：输入变/特征值

y‘s：输出变量/目标变量

(x,y)：训练样本 ->(x⁽ⁱ⁾,y⁽ⁱ⁾):训练集，第i个训练样本，i=1,2..,m

监督学习

定义：(口头表达，非正式)我们给学习算法一个数据集，这个数据集由“正确答案”组成，它的目标是给定某个训练集，需要学习某个函数h:X->Y(x到Y的映射)，使得h(x)就是一个“好”的预测器，能够给出相应的输出值y。函数h称为hypothesis。

解释：首先通过训练集来学习出一个算法得到一个假设函数h，然后利用假设函数来完成x到y的最好映射。

监督学习的例子

假定我们有一个数据集，它给出了居住地和房子价格的关系，如下表格所示：

假设上面的数据有47组，图像如下图所示：

这样根据我们上面给出的训练集我们要经过一个学习算法，得到一个假设函数，使得这个假设函数能更好的拟合我们给出的数据，从而在以后当我们给出房屋的大小时能更好的预测房屋的价格。

如上图所示，假设我们得出的假设函数是一个线性的，这样上面的函数明显比下面相对于我们给出的样本能够更好的拟合。这就是一个监督问题。

监督学习的分类

当我们想要预测的输出值为连续的，例如上例中我们的输出值是价格，那么该学习问题为一个回归（Regression）问题。当输出值y仅能在一个有限的离散值集合中取值，我们称之为分类（Classification）问题。

时间： 2024-10-11 06:56:11

CS229：监督学习的相关文章

斯坦福CS229机器学习课程笔记七：算法诊断、误差分析以及如何开始一个机器学习问题

这一节是Andrew对应用机器学习给出的建议,虽然没有数学公式,但却是十分重要的一课. Debugging Learning Algorithms 假设要做一个垃圾邮件分类的模型,已经从海量的词汇表中选出一个较小的词汇子集(100个单词)作为特征. 用梯度上升算法实现了贝叶斯逻辑回归,但测试集的错误率达到了20%,这显然太高了. 如何解决这个问题? 收集更多的训练样本进一步减少特征数增加特征数改变特征(考虑邮件标题/正文) 将梯度上升多运行几个迭代尝试牛顿方法使用不同的λ 改用SVM

【CS229笔记一】监督学习，线性回归，LMS算法，正态方程，概率解释和局部加权线性回归

监督学习对于一个房价预测系统,给出房间的面积和价格,以面积和价格作坐标轴,绘出各个点. 定义符号: \(x_{(i)}\)表示一个输入特征\(x\). \(y_{(i)}\)表示一个输出目标\(y\). \((x_{(i)},y_{(i)})\)表示一个训练样本. \(\left\{(x_{(i)},y_{(i)});i=1,\dots,m\right\}\)代表m个样本,也称为训练集. 上标\((i)\)代表样本在训练集中的索引. \(\mathcal{X}\)代表输入值的空间,\(\mat

2nd Class_监督学习_线性回归算法

感谢博临天下,笔记太好,我就直接搬过来再添加了.http://www.cnblogs.com/fanyabo/p/4060498.html 一.引言本材料参考Andrew Ng大神的机器学习课程 http://cs229.stanford.edu,以及斯坦福无监督学习UFLDL tutorial http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial 机器学习中的回归问题属于有监督学习的范畴.回归问题的目标是给定D维输入变量x,并且每一个

机器学习有监督学习之--回归

一.引言本材料参考Andrew Ng大神的机器学习课程 http://cs229.stanford.edu,以及斯坦福无监督学习UFLDL tutorial http://ufldl.stanford.edu/wiki/index.php/UFLDL_Tutorial 机器学习中的回归问题属于有监督学习的范畴.回归问题的目标是给定D维输入变量x,并且每一个输入矢量x都有对应的值y,要求对于新来的数据预测它对应的连续的目标值t.比如下面这个例子:假设我们有一个包含47个房子的面积和价格的数据集如

[监督学习]GDA 高斯判别分析

高斯判别分析(Gaussian discriminative analysis )是一个较为直观的模型,基本的假设是我们得到的数据是独立同分布的(IID),虽然在实际中这种假设很难达到,但有时候拥有了好的假设可以得到较好的结果.在Andrew Ng大神的CS229 Lecture notes中有一个例子:假设我们要对大象和狗分类,回归模型和感知机模型是在两类数据之间找到一个decision boundary,通过这个decision boundary来区分大象和狗.高斯判别分析提供了另外一种思路

Machine Learning Algorithms Study Notes(4)—无监督学习（unsupervised learning）

1 Unsupervised Learning 1.1 k-means clustering algorithm 1.1.1 算法思想 1.1.2 k-means的不足之处 1.1.3 如何选择K值 1.1.4 Spark MLlib 实现 k-means 算法 1.2 Mixture of Gaussians and the EM algorithm 1.3 The EM Algorithm 1.4 Principal Components

机器学习（一）--- 监督学习之回归

参考学习资料:http://cs229.stanford.edu/materials.html 通过对学习,掌握的知识点包括: 什么是 cost fuction Linear regression的概念 Logistic regression的概念 ============监督学习的引出============== 机器学习可以分为两个大类,一个是监督学习(supervised learning),一个是无监督学习(unsupervised learning).监督学习的主要任务是通过给定输入样

CS229 1

1.机器学习机器学习是工具,具体应用到某个实际场景下,才是目的. 2.分类 a 监督学习,包括回归(regression),分类(classification).回归问题,数据可以是连续或者离散,分类问题,数据一般是离散的. b 理论学习,机器学习目前主流的算法,用算法工具结合具体使用场景,解决问题. c 无监督学习,包括聚类,通过聚类,转换成类似监督学习的分类模型,当然,无监督模式应用的范围更广. d 强化学习,设计回报函数,类似狗的反射弧效应. 课程信息 http://cs229.stan

资源 | 源自斯坦福CS229，机器学习备忘录在集结

在 Github 上,afshinea 贡献了一个备忘录对经典的斯坦福 CS229 课程进行了总结,内容包括监督学习.无监督学习,以及进修所用的概率与统计.线性代数与微积分等知识. 项目地址:https://github.com/afshinea/stanford-cs-229-machine-learning 据项目介绍,该 repository 旨在总结斯坦福 CS 229 机器学习课程的所有重要概念,包括: 学习该课程所需的重要预备知识,例如概率与统计.代数与微积分等进修课程. 对每个机器

猜你喜欢

作业：JavaScript（数组篇-poker）给我的徒弟出个题。。。记得早点写完，然后大家3人可以早点打牌了

吐槽一下:“今天实际上我左思右想,写个什么东西好呢!手上的笔转了半天....最后还是给自己留点余地!看着他们什么酒店管理系统,呼叫中心系统之类的....简直是把自己固定死了!感觉一撸到底的感觉!!!我 ...

UAC相关问题分析--使用管理员权限打开VisualStudio，无法访问网络磁盘,无法拖拽文件

搬运自http://wurang.me/2014/06/17/uac-problems.html [问题产生] 问题最初是在administrator权限下,visual studio 打开网络磁盘下 ...

[codeforces724E]Goods transportation

试题描述 There are n cities located along the one-way road. Cities are numbered from 1 to n in the direc ...

Servlet & JSP - 转发与重定向的区别

本文转载自:http://blog.csdn.net/kobejayandy/article/details/13762043 转发转发的原理,可以通过下图展示: 浏览器的请求发送给组件 1,组件 ...

pod导入第三方

步骤: 1.首先找到需要配置第三方的文件命令:cd + 鼠标直接拖工程会直接显示文件的位置(Desktop/文件名) 2.创建podfile文件命令是:vim Podfile 3.在podfil ...

FreeRTOS 信号量

@(嵌入式) 简述二进制信号量二进制信号量使用二进制信号量实现创建信号量获取信号量释放信号量中断中释放任务中释放计数信号量互斥锁创建互斥信号量拿锁放锁递归互斥锁获取递归信 ...

PHP封装Excel表方法使用流程

今天总结了一下Excel表的封装和导出使用,原理经常使用与一些日常报表, 数据报表, 实现方法比较简单, 一次封装, 简单的方法调用,简单~ 废话不多说,直接入正题, 先说下重要的参数要记住的东西 ...

分布式系统---1 图灵奖获奖者Barbara Liskov介绍

分布式领域图灵奖牛人Barbara Liskov 维基介绍,英文原文链接https://en.wikipedia.org/wiki/Barbara_Liskov Barbara Liskov教授,就职 ...

STL vector的构造函数和析构函数(2)

原文来自:点击打开链接译文: public member function vector的构造器:这里我只翻译C++11的,C++98的就不翻译了. 构造器原型: <vector> st ...

网络知识学习3---（DNS的作用）

1.DNS 简介 DNS是域名解析协议在互联网中通过IP 地址来进行通信.但是IP 地址的表示形式是数字,很难进行记忆(比如116.213.120.232),所以为每个 IP取一个人类更易记忆的域名 ...

1.如果根据一些Id进行删除,那么会用到In的用法如: <delete id="DeleteByIds" parameterClass="UserInfo" ...

关于产品的一些思考——(四十一)网易之有道云笔记

--------------------2014.07.17-------------------- 先前的使用体验,补上. 建议在有道云笔记安装的时候,就可以由用户设置笔记和图片存储目录,并且用户可 ...

我为NET狂官方面试题-数据库篇答案

?说明:如有错误可以批评指正,有更好写法也可以提点下~ ? 1.?求结果:select "1"? 报错,SQL里面只有单引号,列如:'xx' ? ? 2.?查找包含"ob ...

同义词(学习笔记)

同义词 = 表的别名语法:CREATE [PUBLIC] SYNONYM 同义词名称 FOR 数据库对象 ; 示例一. --使用管理员创建或者具有创建同义词权限的用户 --为scott创建同义词 C ...

Python朝花夕拾

Q1:HTTP Error 403: Forbidden python中经常使用urllib2.urlopen函数提取网页源码,但是有些时候这个函数返回的却是:HTTP Error 403: Forb ...

2，单例模式

一.什么是单例模式单例模式是一种对象创建型模式,使用单例模式,可以保证为一个类只生成唯一的实例对象.也就是说,在整个程序空间中,该类只存在一个实例对象.其实,GoF对单例模式的定义是:保证一个类.只 ...

addObserver forKeyPath options 注意事项

[self.layer addObserver:self forKeyPath:@"cornerRadius" options:NSKeyValueObservingOptionN ...

Appium 重要代码

1.查找唯一识别号adb devices 2.简单使用appium启动appium服务端:第一种方式:Dos命令窗口输入appium,直到出现debug为止第二种方式:找到安装路径下的appium. ...

DevExpress的TcxDBLookupComboBox使用方法及问题

使用TcxDBLookupComboBox需要设置以下属性: 1.DataBinding.DataSource:数据感知控件的数据源. 2.DataBinding.DataField:数据感知控件的连 ...

mac机子上装ie6和ie11

下载一个虚拟机,vmware 下载一个 xp的镜像文件和win7的镜像文件启动虚拟机,点击『添加』一步一步就可以装了最后安装vmware tools [是VMware虚拟机中自带的一种增强工具,增 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.