【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值

本题目来自吴恩达机器学习视频。

题目：

你是一个餐厅的老板，你想在其他城市开分店，所以你得到了一些数据（数据在本文最下方），数据中包括不同的城市人口数和该城市带来的利润。第一列是城市的人口数，第二列是在这个城市开店所带来的利润数。

现在，假设一开始θ0和θ1都是0，利用梯度下降的方法，找到合适的θ值，其中学习速率α=0.01，迭代轮次为1000轮

上一个文章里，我们得出了CostFunction，即损失函数。

现在我们需要找到令损失函数最小的θ值，利用梯度下降函数

1、导包

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

2、之前写的CostFunction函数

def computeCost(X, y, theta):
    inner = np.power(((X * theta.T) - y), 2)
    return np.sum(inner) / (2 * len(X))

3、引入文件，把X和Y分开，在X左边加一列1，θ0和θ1设置为0，0

path = ‘ex1data1.txt‘
data = pd.read_csv(path, header=None, names=[‘Population‘, ‘Profit‘])

data.insert(0, ‘Ones‘, 1)rows = data.shape[0]cols = data.shape[1]X = data.iloc[:, 0:cols - 1]Y = data.iloc[:, cols - 1:cols]theta = np.mat(‘0,0‘)X = np.mat(X.values)Y = np.mat(Y.values)

cost = computeCost(X, Y, theta)

4、设置更新速率α为0.01，设置迭代次数为1000次

alpha = 0.01
iters = 1500

5、写出梯度下降函数的实现

def gradientDescent(X, Y, theta, alpha, iters):
    temp = np.mat(np.zeros(theta.shape))  # 一个数组，temp大小为θ的个数
    parameters = int(theta.ravel().shape[1])  # 参数的个数
    cost = np.zeros(iters)  # 一个数组，存着每次计算出来的costFunction的值

    for i in range(iters):
        error = (X*theta.T)-Y;  #误差值
        for j in range(parameters):
            term = np.multiply(error,X[:, j])
            temp[0,j] = theta[0,j] - ((alpha/len(X)) * np.sum(term))
        theta = temp
        cost[i] = computeCost(X,Y,theta)
    return theta, cost

解析：

temp数组存的是临时变量，因为所有的θ需要同步更新，所以先存入临时变量中，后面计算完所有θ的值后再同步更新。

parameters是一个int值的数，即有多少个变量，本题中有θ0和θ1，所以parameters=2

cost是一个数组，大小和迭代次数一样，每一层存放当前迭代次数下的CostFunction的返回值

6、调用函数，并返回结果

g, cost = gradientDescent(X, Y, theta, alpha, iters)
print(g)

最后结果g=[[-3.24140214 1.1272942 ]]

即最后的θ0=-3.24 θ1=1.127

7、把图打出来，看看是否收敛

fig, ax = plt.subplots(figsize=(12,8))
ax.plot(np.arange(iters),cost,‘r‘)
ax.set_xlabel(‘Iterations‘)
ax.set_ylabel(‘Cost‘)
plt.show()

发现随着迭代次数iters的增大，损失慢慢的降低，所以有效，计算正确。

原文地址：https://www.cnblogs.com/qinyuguan/p/11622656.html

时间： 2024-11-03 12:48:42

【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值的相关文章

机器学习入门——单变量线性回归

线性回归的概念,在高中数学书里就出现过. 给你一些样本点,如何找出一条直线,使得最逼近这些样本点. 给出一个例子:假设 x 是房子面积,y是房子价格,确定一条直线需要theta0和theta1. 给出x,我们就可以计算出房子的价格 h(x) = theta0+theta1*x 关键是如何计算出theta0和theta1,也就是如何找出这么一条直线呢? 在这里,引入一个概念,叫做cost function.m表示样本个数,也就是训练样本数目这是一个square error,学过统计的应该经常见到

机器学习 (一) 单变量线性回归 Linear Regression with One Variable

文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang和 JerryLead 的个人笔记,为我做个人学习笔记提供了很好的参考和榜样. § 1. 单变量线性回归 Linear Regression with One Variable 1. 代价函数Cost Function 在单变量线性回归中,已知有一个训练集有一些关于x.y的数据(如×所示),当我们的预测值

机器学习：单变量线性回归及梯度下降

******************************************************************************* 注:本系列博客是博主学习Stanford大学 Andrew Ng 教授的<机器学习>课程笔记.博主深感学过课程后,不进行总结很容易遗忘,根据课程加上自己对不明白问题的补充遂有此系列博客.本系列博客包括线性回归.逻辑回归.神经网络.机器学习的应用和系统设计.支持向量机.聚类.将维.异常检测.推荐系统及大规模机器学习等内容. *******

机器学习之单变量线性回归（Linear Regression with One Variable）

1. 模型表达(Model Representation) 我们的第一个学习算法是线性回归算法,让我们通过一个例子来开始.这个例子用来预测住房价格,我们使用一个数据集,该数据集包含俄勒冈州波特兰市的住房价格.在这里,我要根据不同房屋尺寸所售出的价格,画出我的数据集: 我们来看这个数据集,如果你有一个朋友正想出售自己的房子,如果你朋友的房子是1250平方尺大小,你要告诉他们这房子能卖多少钱. 那么,你可以做的一件事就是构建一个模型,也许是条直线.从这个数据模型上来看,也许你可以告诉你的朋友,他大概

Stanford公开课机器学习---2.单变量线性回归(Linear Regression with One Variable)

单变量线性回归(Linear Regression with One Variable) 2.1 模型表达(Model Representation) m 代表训练集中实例的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 (x,y) 代表训练集中的实例 (x(i),y(i) ) 代表第 i 个观察实例 h 代表学习算法的解决方案或函数也称为假设(hypothesis) 单变量线性回归:只含有一个特征/输入变量 x hθ=θ0+θ1x 2.2 代价函数(Cost Function) 目标

【Python】机器学习之单变量线性回归练习（计算Cost Function）

注:练习来自于吴恩达机器学习翻译后的题目: 你是一个餐厅的老板,你想在其他城市开分店,所以你得到了一些数据(数据在本文最下方),数据中包括不同的城市人口数和该城市带来的利润.第一列是城市的人口数,第二列是在这个城市开店所带来的利润数. 现在,假设θ0和θ1都是0,计算CostFunction,即计算损失函数首先,本题线性回归的公式应该是这样的: H(θ) = θ0 + θ1*X 简单的来说,本题中,θ0和θ1都为0,即求H(θ) = 0的损失值, 然后我们再给出损失的定义: 损失,通俗的来讲

单变量线性回归

单变量线性回归单变量线性回归指的是只有一个自变量: 线性回归是一种有监督学习,解决的是自变量和因变量之间的关系: 回归指的是因变量是连续性的,而如果因变量是离散型的,则是分类问题. 监督学习算法的工作方式可以用如下这张图表示: 将训练集喂给机器学习算法,输出一个假设函数 h,然后新输入一个自变 x 到假设函数内,然后输出一个因变量 y 值. 以房价预测为列,特征为房子的大小,因变量是房价.那么对于一个新的房子的大小,我们如何根据历史的数据来预测出来该房子的价格呢? ?θ(x)= θ0+θ 1,

机器学习 Machine Learning（by Andrew Ng）----第二章单变量线性回归(Linear Regression with One Variable)

第二章单变量线性回归(Linear Regression with One Variable) <模型表示(Model Representation)> <代价函数(Cost Function)> <梯度下降(Gradient Descent)

机器学习第2课：单变量线性回归(Linear Regression with One Variable)

2.1 模型表示之前的房屋交易问题为例,假使我们回归问题的训练集(Training Set)如下表所示: 我们将要用来描述这个回归问题的标记如下: m 代表训练集中实例的数量 x 代表特征/输入变量 y 代表目标变量/输出变量 (x,y) 代表训练集中的实例 (x(i),y(i) ) 代表第 i 个观察实例 h 代表学习算法的解决方案或

【Python】机器学习之单变量线性回归 利用批量梯度下降找到合适的参数值

【Python】机器学习之单变量线性回归 利用批量梯度下降找到合适的参数值的相关文章

【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值

【Python】机器学习之单变量线性回归利用批量梯度下降找到合适的参数值的相关文章