机器学习第2课：单变量线性回归(Linear Regression with One Variable)

　　

　　2.1 模型表示

　　之前的房屋交易问题为例，假使我们回归问题的训练集（Training Set）如下表所示：

　　

　　　　

　　　　我们将要用来描述这个回归问题的标记如下:

　　　　 m 代表训练集中实例的数量

　　　　 x 代表特征/输入变量

　　　　 y 代表目标变量/输出变量

　　　　 (x,y) 代表训练集中的实例

　　　　(x(i),y(i) ) 代表第 i 个观察实例

　　　　h 代表学习算法的解决方案或函数也称为假设（hypothesis）

　　　　

　　

　　　　因而，要解决房价预测问题，我们实际上是要将训练集“喂”给我们的学习算法，进而学习得到一个假设 h，然后将我们要预测的房屋的尺寸作为输入变量输入给 h，预测出该房屋的交易价格作为输出变量输出为结果。

　　那么，对于我们的房价预测问题，我们该如何表达 h？

　　一种可能的表达方式为：，因为只含有一个特征/输入变量，因此这样的问题叫作单变量线性回归问题。

　　2.2 代价函数

　　如图：

　　

　　

　　　　我们现在要做的便是为我们的模型选择合适的参数（parameters）θ0 和 θ1，在房价问题这个例子中便是直线的斜率和在 y 轴上的截距。

　　　我们选择的参数决定了我们得到的直线相对于我们的训练集的准确程度，模型所预测的值与训练集中实际值之间的差距（下图中蓝线所指）就是建模误差（modeling error）。

　　

　　

　　　　我们的目标便是选择出可以使得建模误差的平方和能够最小的模型参数。即使得代价函数最小。

　　　　我们绘制一个等高线图，三个坐标分别为 θ0 和 θ1 和 J(θ0,θ1)：

　　

　　　　则可以看出在三维空间中存在一个使得 J(θ0,θ1)最小的点

　　

　　2.3 代价函数的直观理解 I

　　

　　

　　2.4 代价函数的直观理解 II

　　

　　代价函数的样子

　　

　　

　　2.5 梯度下降

　　　　梯度下降是一个用来求函数最小值的算法，我们将使用梯度下降算法来求出代价函数J(θ0,θ1) 的最小值。梯度下降背后的思想是：开始时我们随机选择一个参数的组合（θ0,θ1,...,θn），计算代价函数，

　　然后我们寻找下一个能让代价函数值下降最多的参数组合。我们持续这么做直到到到一个局部最小值（local minimum），因为我们并没有尝试完所有的参数组合，所以不能确定我们得到的局部最小值是否便是

　　全局最小值（global minimum），选择不同的初始参数组合，可能会找到不同的局部最小值。

　　

　　批量梯度下降（batch gradient descent）算法的公式为：

　　

　　其中 α 是学习率（learning rate），它决定了我们沿着能让代价函数下降程度最大的方向向下迈出的步子有多大，在批量梯度下降中，我们每一次都同时让所有的参数减去学习速率乘以代价函数的导数。

　　

　　

　　注意：要同时更新θ0,θ1才可以，千万不要忘记

　　2.6 梯度下降的直观理解

　　　　梯度下降算法如下图：

　　

　　

　　　　描述：对θ赋值，使得 J(θ)按梯度下降最快方向进行，一直迭代下去，最终得到局部最小值。

　　其中 α 是学习率（learning rate），它决定了我们沿着能让代价函数下降程度最大的方向向下迈出的步子有多大。

　　　　

　　

　　

　　2.7 梯度下降的线性回归

　　　　梯度下降算法和线性回归算法比较如图：

　　

　　　　对我们之前的线性回归问题运用梯度下降法，关键在于求出代价函数的导数，即：

　　

　　　　j=0 时：

　　

　　　　j=1 时：

　　　

　　　　则算法改写成：

　　

　　

　　2.8 接下来的内容

　　　　在接下来的一组视频中，我会对线性代数进行一个快速的复习回顾。如果你从来没有接触过向量和矩阵，那么这课件上所有的一切对你来说都是新知识，或者你之前对线性代数有所了解，但由于隔得久了，

　　对其有所遗忘，那就请学习接下来的一组视频，我会快速地回顾你将用到的线性代数知识。

　　　　通过它们，你可以实现和使用更强大的线性回归模型。事实上，线性代数不仅仅在线性回归中应用广泛，它其中的矩阵和向量将有助于帮助我们实现之后更多的机器学习模型，并在计算上更有效率。

　　正是因为这些矩阵和向量提供了一种有效的方式来组织大量的数据，特别是当我们处理巨大的训练集时，如果你不熟悉线性代数，如果你觉得线性代数看上去是一个复杂、可怕的概念，特别是对于之前从未接触过它的人，

　　　　不必担心，事实上，为了实现机器学习算法，我们只需要一些非常非常基础的线性代数知识。通过接下来几个视频，你可以很快地学会所有你需要了解的线性代数知识。具体来说，为了帮助你判断是否有需要学习接

　　下来的一组视频，我会讨论什么是矩阵和向量，谈谈如何加、减、乘矩阵和向量，讨论逆矩阵和转置矩阵的概念

　　　　如果你十分熟悉这些概念，那么你完全可以跳过这组关于线性代数的选修视频，但是如果你对这些概念仍有些许的不确定，不确定这些数字或这些矩阵的意思，那么请看一看下一组的视频，

　　它会很快地教你一些你需要知道的线性代数的知识，便于之后编写机器学习算法和处理大量数据。

时间： 2024-09-30 15:53:22

机器学习第2课：单变量线性回归(Linear Regression with One Variable)的相关文章

机器学习（二）--------单变量线性回归(Linear Regression with One Variable)

面积与房价训练集 (Training Set) Size Price 2104 460 852 178 ...... m代表训练集中实例的数量x代表输入变量 y代表输出变量 (x,y)代表训练集中的实例 h代表方案或者假设 h = a x + b 输入变量输入给h 得到输出结果因为只有一个特征所以是单变量线性回归问题 a b就是代价参数求ab就是建模 ab算完和实际的差距叫建模误差寻找ab平方和最小点就是代价

Ng第二课：单变量线性回归(Linear Regression with One Variable)

二.单变量线性回归(Linear Regression with One Variable) 2.1 模型表示 2.2 代价函数 2.3 代价函数的直观理解 2.4 梯度下降 2.5 梯度下降的直观理解 2.6 梯度下降的线性回归 2.7 接下来的内容 2.1 模型表示之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示: 我们将要用来描述这个回归问题的标记如下: m 代表训练集中实例的数量 x

机器学习 Machine Learning（by Andrew Ng）----第二章单变量线性回归(Linear Regression with One Variable)

第二章单变量线性回归(Linear Regression with One Variable) <模型表示(Model Representation)> <代价函数(Cost Function)> <梯度下降(Gradient Descent)

机器学习 (一) 单变量线性回归 Linear Regression with One Variable

文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang和 JerryLead 的个人笔记,为我做个人学习笔记提供了很好的参考和榜样. § 1. 单变量线性回归 Linear Regression with One Variable 1. 代价函数Cost Function 在单变量线性回归中,已知有一个训练集有一些关于x.y的数据(如×所示),当我们的预测值

Stanford公开课机器学习---2.单变量线性回归(Linear Regression with One Variable)

单变量线性回归(Linear Regression with One Variable) 2.1 模型表达(Model Representation) m 代表训练集中实例的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 (x,y) 代表训练集中的实例 (x(i),y(i) ) 代表第 i 个观察实例 h 代表学习算法的解决方案或函数也称为假设(hypothesis) 单变量线性回归:只含有一个特征/输入变量 x hθ=θ0+θ1x 2.2 代价函数(Cost Function) 目标

斯坦福第二课：单变量线性回归(Linear Regression with One Variable)

2.1 模型表示之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示: 我们将要用来描述这个回归问题的标记如下: m 代表训练集中实例的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 (x,y) 代表训练集中的实例 (x(i),y(i) ) 代表第 i 个观察实例 h 代表学习算法的解决方案或函数

二、单变量线性回归(Linear Regression with One Variable)

本笔记为吴恩达机器学习在线课程笔记,课程网址(https://www.coursera.org/learn/machine-learning/) 2.1 模型表示参考视频: 2 - 1 - Model Representation (8 min).mkv 本课程讲解的第一个算法为"回归算法",本节将要讲解到底什么是Model.下面,以一个房屋交易问题为例开始讲解,如下图所示(从中可以看到监督学习的基本流程). 所使用的数据集为俄勒冈州波特兰市的住房价格,根据数据集中的不同房屋尺寸所对

Coursera《machine learning》--（2）单变量线性回归(Linear Regression with One Variable)

本笔记为Coursera在线课程<Machine Learning>中的单变量线性回归章节的笔记. 2.1 模型表示参考视频: 2 - 1 - Model Representation (8 min).mkv 本课程讲解的第一个算法为"回归算法",本节将要讲解到底什么是Model.下面,以一个房屋交易问题为例开始讲解,如下图所示(从中可以看到监督学习的基本流程). 所使用的数据集为俄勒冈州波特兰市的住房价格,根据数据集中的不同房屋尺寸所对应的出售价格,绘制出了数据集:假如

Stanford机器学习---第二讲. 多变量线性回归 Linear Regression with multiple variable

原文:http://blog.csdn.net/abcjennifer/article/details/7700772 本栏目(Machine learning)包括单参数的线性回归.多参数的线性回归.Octave Tutorial.Logistic Regression.Regularization.神经网络.机器学习系统设计.SVM(Support Vector Machines 支持向量机).聚类.降维.异常检测.大规模机器学习等章节.所有内容均来自Standford公开课machine

猜你喜欢

杭电1021

观察数列中每项除3的余数,分别是1,2,0,2,2,1,0,1,1,2,0.用数学归纳法可以证出这个规律(在此略过)发现每八项出现一次循环所以n满足n=8k+2或n=8k-2 (k是自然数) #inc ...

css深入理解padding

padding 中规中矩,性格温婉平和! 第一节:CSS padding与容器的尺寸--了解padding与元素尺寸之间关系 CSS padding与容器的尺寸关系复杂对于block水平元素没有p ...

android源码解析（十八）-->Activity布局绘制流程

这篇文章是承接上一篇文章(Android布局加载流程:http://blog.csdn.net/qq_23547831/article/details/51284556)来写的,大家都知道Activi ...

最近碰到的一些 SSL 问题记录

最近碰到一些 SSL 的小问题,特记录下. 我们有个 Java 实现的 SSL TCP 服务端,为客户端(PC.Android 和 iOS)提供 SSL 接入连接服务.最近有用户反馈其手机上 App ...

[容易]二分查找

题目来源:http://www.lintcode.com/zh-cn/problem/first-position-of-target/ 可以accept的程序如下(用了STL): 1 class S ...

一个有用的python装饰器 -- 为执行程序加锁

最近在写python项目的时候遇到一个问题有这样一个python脚本: 1 脚本功能 A 监控网卡的实时流量,如果该流量超过设定阀值就去增加带宽(购买带宽包) B 脚本放在 crontab 中,并 ...

CAS—认证原理

CAS,Central Authentication Service-中央认证服务,是Yale 大学发起的一个企业级的.开源的项目,旨在为Web应用系统提供一种可靠的SSO解决方案.下面简单介绍SSO ...

PS域业务与CS域业务的区别

1.CS和PS是针对核心网部分而言的,两者的不同在于交换方式.CS是电路交换,通信之前,资源预留,不同用户独占各自分配的资源,没有统计复用.PS是包交换,不同的用户可以共享同样的资源,统计复用.包交换 ...

线程安全的查找表

template<typename Key, typename Value, typename Hash = std::hash<Key>> class ThreadsafeL ...

关情纸尾-----Quartz2D简介

1.什么是Quartz2D? 他是一个二维的绘图引擎,同时支持iOS和Mac系统 2.Quartz2D能完成的工作? 画基本线条,绘制文字,图片,截图,自定义UIView. 3.Quartz2D在开发 ...

Android LRUCache

17 package android.util; 18 19 import java.util.LinkedHashMap; 20 import java.util.Map; 21 22 /** 23 ...

java生产者/消费者模式实现——一生产者一消费者（操作值）

胶多不粘话多不甜,直接上代码: 生产者类: /** * Created by 51304 on 2016/2/28. */ public class P { private String lock; ...

zoj 3726 水题+二分

Alice's Print Service Time Limit: 2 Seconds Memory Limit: 65536 KB Alice is providing print ser ...

原来这么拍（四）——牵手拍合影

tips1:当做风光照片去拍摄,预留任务位置 tips2:使用延时自拍功能,预留拍摄时间会用到两个道具:GND渐变灰滤镜,另一个是CPL偏振镜 tips3:CPL偏振镜的作用是消除反光也就是消除一 ...

交换机监控

交换机需要采集的指标项包括:电源.端口状态.端口映射(物理端口&逻辑端口).温度.内存.cpu(最大cpu.平均cpu).端口出入流量(需要计算峰值流量).端口带宽使用率等,其中分品牌采集不同 ...

zoj 3103 Cliff Climbing 优先队列+BFS

题目链接: 3103 题意: 一块N X M 的墙壁,求从S点出发到T点的最短时间每次只能爬一步,且只能左右脚交替爬行,墙上每个方块中的数字标明方块的"光滑等级",标有数字t ...

苹果平板电脑维修ipad5屏幕更换多少钱屏幕坏了怎么办（推荐维修）

为什么网上的价格差距这么大?为什么打电话问的商家报的价格都不一样?哪种几百块钱的屏幕(芯片)能相信吗?淘宝上面的屏幕(芯片)能相信吗?哪里能找到原装的屏幕呢?哪里的维修点才靠谱呢?北京中关村和深圳那边 ...

iscroll 下拉刷新，上拉加载

新手,直接贴代码了 <!DOCTYPE html><html class=""><head lang="en"><me ...

远程连接SuSE系统的配置方法

今天,在VMware上搭建了SuSE Linux系统,使用xshell远程进行连接,一直连接不上,后来百度了一下,连接成功,这里总结一下配置的办法: (1):关闭防火墙 (2):配置sshd( Pas ...

android学习视频分享

最近整理了大量的安卓开发学习资料,有书籍有视频有代码,老罗的第一季有点老了, 这里就给大家分享下老罗的第二季的视频教程吧,还有源码,初级到高级程序猿都有用. 下载地址:http://51pansou. ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.039 s.