【stanford 机器学习】学习笔记(1)--单变量线性回归

课程来自斯坦福大学吴恩达教授 machine learning：

https://www.coursera.org/learn/machine-learning/home/welcome

1) Model representation(模型表示)

回到房屋价格预测问题，首先它是一个有监督学习的问题（对于每个样本的输入，都有正确的输出或者答案），同时它也是一个回归问题（预测一个实值输出）。训练集表示如下：

其中：

m = 训练样本的数目

x’s = “输入”变量，也称之为特征

y’s = “输出”变量，也称之为“目标”变量

对于房价预测问题，学习过程可用下图表示：

其中x代表房屋的大小，y代表预测的价格，h(hypothesis)将输入变量 x 映射到输出变量 y，如何表示h?

事实上Hypothesis可以表示成如下形式：

h_θ(x)=θ₀+θ₁x

简写为 h(x)，也就是带一个变量的线性回归或者单变量线性回归问题。

2) Cost function(代价函数，成本函数)

对于Hypothesis: h_θ(x)=θ₀+θ_1，θi 为参数，因此如何求θi?

构想：对于训练集(x, y)，选取参数θ0, θ1使得hθ(x)尽可能的接近y。

如何做呢？一种做法就是求训练集的平方误差函数（squared error function），Cost Function可表示为:

J(θ₀,θ₁)=12m∑i=1m(hθ(x(i))–y(i))2

并且选取合适的参数使其最小化，数学表示如下：

minimizeθ0,θ1J(θ0,θ1)

3) Cost function intuition I(直观解释1)

直观来看，线性回归主要包括如下四大部分，分别是Hypothesis, Parameters, Cost Function, Goal:

这里作者给出了一个简化版的Cost function解释，也就是令θ0为0：

然后令θ1分别取1、0.5、-0.5等值，同步对比hθ(x)和J(θ0,θ1)在二维坐标系中的变化情况，具体可参考原PPT中的对比图，很直观。

4) Cost function intuition II(直观解释2)

回顾线性回归的四个部分，这一次不在对Cost Function做简化处理，这个时候J(θ0,θ1)的图形是一个三维图或者一个等高线图，具体可参考原课件。

可以发现，当hθ(x)的直线越来越接近样本点时，J(θ0,θ1)在等高线的图中的点越来越接近最小值的位置。

5) Gradient descent(梯度下降)

应用的场景之一-最小值问题：

对于一些函数，例如J(θ0,θ1)

目标: minθ0,θ1J(θ0,θ1)

方法的框架:

1、给θ0, θ1一个初始值，例如都等于0

2、每次改变θ0, θ1的时候都保持J(θ0,θ1)递减，直到达到一个我们满意的最小值；

对于任一J(θ0,θ1) , 初始位置不同，最终达到的极小值点也不同，例如以下两个例子：

梯度下降算法：

重复下面的公式直到收敛：

举例：

参数正确的更新过程如下（同步更新）：

错误的更新过程如下：

6) Gradient descent intuition(梯度下降直观解释)

举例，对于一个简化的J(θ1)来说，无论抛物线的左边还是右边，在梯度下降算法下，θ1)都是保持正确的方向（递增或递减）

对于learning rate(又称为步长)来说:

如果α过小，梯度下降可能很慢；如果过大，梯度下降有可能“迈过”（overshoot）最小点，并且有可能收敛失败，并且产生“分歧”(diverge)

梯度下降可以使函数收敛到一个局部最小值，特别对于learning rate α是固定值的时候：

当函数接近局部最小值的时候，梯度下降法将自动的采取“小步子”，所以没有必要随着时间的推移减小learning rate.

关于梯度下降算法，可以参考维基百科的介绍：http://zh.wikipedia.org/wiki/%E6%A2%AF%E5%BA%A6%E4%B8%8B%E9%99%8D%E6%B3%95

7) Gradient descent for linear regression(应用于线性回归的的梯度下降算法)

梯度下降算法：

线性回归模型：

J(θ0,θ1)对于θ0), θ1)求导，得：

在梯度下降算法中进行替换，就得到单变量线性回归梯度下降算法：

详细的图形举例请参考官方PPT，主要是在等高线图举例梯度下降的收敛过程，逐步逼近最小值点，其中一幅图说明：线性回归函数是凸函数(convex function)，具有碗状（bowl shape)。

总结：这里的梯度下降算法也称为”Batch” 梯度下降: 梯度下降的每一步都使用了所有的训练样本。

时间： 2024-10-08 05:30:26

【stanford 机器学习】学习笔记(1)--单变量线性回归的相关文章

机器学习（二）--------单变量线性回归(Linear Regression with One Variable)

面积与房价训练集 (Training Set) Size Price 2104 460 852 178 ...... m代表训练集中实例的数量x代表输入变量 y代表输出变量 (x,y)代表训练集中的实例 h代表方案或者假设 h = a x + b 输入变量输入给h 得到输出结果因为只有一个特征所以是单变量线性回归问题 a b就是代价参数求ab就是建模 ab算完和实际的差距叫建模误差寻找ab平方和最小点就是代价

机器学习：单变量线性回归及梯度下降

******************************************************************************* 注:本系列博客是博主学习Stanford大学 Andrew Ng 教授的<机器学习>课程笔记.博主深感学过课程后,不进行总结很容易遗忘,根据课程加上自己对不明白问题的补充遂有此系列博客.本系列博客包括线性回归.逻辑回归.神经网络.机器学习的应用和系统设计.支持向量机.聚类.将维.异常检测.推荐系统及大规模机器学习等内容. *******

机器学习【第二篇】单变量线性回归

吴恩达机器学习笔记整理--单变量线性回归通过模型分析,拟合什么类型的曲线. 一.基本概念 1.训练集由训练样例(training example)组成的集合就是训练集(training set), 如下图所示,其中(x,y)是一个训练样本,训练集中每一行表示一个训练样本;(x^i,y^i)表示第i个训练样本. 2.假设函数h 使用某种学习算法对训练集的数据进行训练, 我们可以得到假设函数(Hypothesis Function), 如下图所示. 在房价的例子中,假设函数就是一个房价关于房子面

Stanford机器学习课程笔记——单变量线性回归和梯度下降法

Stanford机器学习课程笔记--单变量线性回归和梯度下降法 1. 问题引入单变量线性回归就是我们通常说的线性模型,而且其中只有一个自变量x,一个因变量y的那种最简单直接的模型.模型的数学表达式为y=ax+b那种,形式上比较简单.Stanford的机器学习课程引入这个问题也想让我们亲近一下machine learning这个领域吧~吴恩达大神通过一个房屋交易的问题背景,带领我们理解Linear regression with one variable.如下: 不要看这个问题简答,大神就是大神

【吴恩达机器学习】学习笔记——2.1单变量线性回归算法

1 回顾1.1 监督学习定义:给定正确答案的机器学习算法分类:(1)回归算法:预测连续值的输出,如房价的预测(2)分类算法:离散值的输出,如判断患病是否为某种癌症1.2 非监督学习定义:不给定数据的信息的情况下,分析数据之间的关系.聚类算法:将数据集中属性相似的数据点划分为一类. 2 单变量线性回归算法2.1 符号定义m = 训练样本的数量x = 输入变量y = 输出变量2.2 工作方式训练集通过学习算法生成线性回归函数hypothesis hθ(x) = θ0 + θ1x 原文地址:http

Stanford机器学习Week 1—单变量线性回归

本篇讲述以下内容: 单变量线性回归代价函数梯度下降单变量线性回归回顾下上节,在回归问题中,我们给定输入变量,试图映射到连续预期结果函数上从而得到输出.单变量线性回归就是从一个输入值预测一个输出值.输入/输出的对应关系就是一个线性函数. 下面是一个根据房屋面积预测房屋价格的例子. 假设有一个数据集,我们称作训练集,数据集包括房屋面积和房屋价格数据. x:表示输入变量,也叫特征变量. y:表示输出变量,也叫目标变量. (xi,yi):表示一个识训练样本,训练集的一行.i 表示第 i 个训练

Stanford公开课机器学习---2.单变量线性回归(Linear Regression with One Variable)

单变量线性回归(Linear Regression with One Variable) 2.1 模型表达(Model Representation) m 代表训练集中实例的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 (x,y) 代表训练集中的实例 (x(i),y(i) ) 代表第 i 个观察实例 h 代表学习算法的解决方案或函数也称为假设(hypothesis) 单变量线性回归:只含有一个特征/输入变量 x hθ=θ0+θ1x 2.2 代价函数(Cost Function) 目标

机器学习 (一) 单变量线性回归 Linear Regression with One Variable

文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang和 JerryLead 的个人笔记,为我做个人学习笔记提供了很好的参考和榜样. § 1. 单变量线性回归 Linear Regression with One Variable 1. 代价函数Cost Function 在单变量线性回归中,已知有一个训练集有一些关于x.y的数据(如×所示),当我们的预测值

机器学习之单变量线性回归（Linear Regression with One Variable）

1. 模型表达(Model Representation) 我们的第一个学习算法是线性回归算法,让我们通过一个例子来开始.这个例子用来预测住房价格,我们使用一个数据集,该数据集包含俄勒冈州波特兰市的住房价格.在这里,我要根据不同房屋尺寸所售出的价格,画出我的数据集: 我们来看这个数据集,如果你有一个朋友正想出售自己的房子,如果你朋友的房子是1250平方尺大小,你要告诉他们这房子能卖多少钱. 那么,你可以做的一件事就是构建一个模型,也许是条直线.从这个数据模型上来看,也许你可以告诉你的朋友,他大概