[What-Why-How] 线性回归预测

What

现有多个变量X1, X2, X3, ....会对结果数据Y产生影响,现在要求出这些变量Xn对于最终结果的影响权重。找到一个线(两个变量),面(三个变量)来拟合这些权重的数值。通过训练数据得到这些参数,然后使用这些参数(模型)对新数据进行预测

例如,拟合一个平面:

其中 θ0表示预置的权重参数。

  • 误差

  真实值和预测值之间肯定是要存在差异的

  误差是独立并且具有相同分布,并且服从均值为0方差为θ2的高斯分布(正态分布)

  似然函数:,什么样的参数跟我们的数据组合后恰好时真实值。  样本数据 -> 参数,参数估计。最大似然函数,极大似然估计,让结果符合真实值的概率最大。

  对数似然:,似然函数的对数形式,便于计算。

  目标函数:,从对数似然化简得出,目标函数值越小似然函数值越大。对目标函数求偏导,在其偏导数为0点的,为极小值点:

  • 评估方法

  最常用的评估项:R2,其值越接近1认为结果约好。

  • 梯度下降

  得到一个目标函数后,如何进行求解。

  目标函数:,寻找山谷最低点,即函数终点

  如果有多个参数,是每个参数分布求极值,每次一小点,不断的更新参数

  梯度下降的方法:

    •   批量梯度下降  

      容易得到最优解,但每次要考虑所有样本,速度很慢

    •   随机梯度下降

      每次找一个样本,迭代速度快,但不一定每次朝着收敛的方向

    •    小批量梯度下降 batch  

      每次更新选择一小部分数据来计算,较实用

  不同步长(学习率)对结果会有大影响。一般要小一些,从小值开始,不行再小。批量的大小,在机器资源允许的情况下尽量大些。

Why

How

原文地址:https://www.cnblogs.com/vectorli/p/11963192.html

时间: 2024-10-08 14:35:22

[What-Why-How] 线性回归预测的相关文章

C# chart.DataManipulator.FinancialFormula()公式的使用 线性回归预测方法

最近翻阅资料,找到 chart.DataManipulator.FinancialFormula()公式的使用,打开另一扇未曾了解的窗,供大家分享一下. 一 DataManipulator类 运行时,执行数据操作.此类是通过chart中DataManipulator属性对外公开的. 在C#中的继承关系如下: System.Object System.Web.UI.DataVisualization.Charting.DataFormula System.Web.UI.DataVisualizat

线性回归预测波士顿房价

预测波士顿的房价,上次已经通过房间数目预测了房价,这次用多元线性回归预测. 根据之前推导的多元线性回归的参数 接下来是多元线性回归的代码实现 def LinearRegression_(x,y): np.array(x) np.array(y) a = (np.linalg.inv(x.T.dot(x))).dot(x.T).dot(y) 上次大致了解了得个feature的name.下面是‘ZN’和‘RM’的散点图(由于我比较懒所以只实现这两个) 我们可以看出每个特征的数据范围相差较大,为了加快

SPSS-如何进行多元线性回归预测

http://jingyan.baidu.com/article/4e5b3e1955c89391901e24d0.html 在数据分析行业内,最困难的一项工作就是对未来的某项变化进行预测,以下给各位分享如何利用多元线性回归模型对因变量进行预测: 步骤: 建立预测模型:这里模型为:本例中收集了某地区过去16年的蛾量.卵量.降水量.雨日以及幼虫密度的历史数据,这里蛾量.卵量.降水量和雨日可以统计得到,因此需要这4个自变量来预测因变量幼虫密度,这里建立模型Y=a+x1*b1+x2*b2+x3*b3+

tensorflow线性回归预测鲍鱼数据

代码如下: import tensorflow as tf import csv import numpy as np import matplotlib.pyplot as plt # 设置学习率 learning_rate = 0.01 # 设置训练次数 train_steps = 1000 #数据地址:http://archive.ics.uci.edu/ml/datasets/Abalone with open('./data/abalone.data') as file: reader

机器学习算法·回归预测

一.回归预测简介 现在我们知道的回归一词最早是由达尔文的表兄弟Francis Galton发明的.Galton在根据上一年的豌豆种子的尺寸预测下一代豌豆种子的尺寸时首次使用了回归预测.他在大量的对象上应用了回归分析,包括人的身高.他注意到,如果双亲的高度比平均高度高的话,则他们的子女也倾向于比平均身高高,但尚不及双亲.孩子的身高向着平均高度回退(回归).Galton在多项研究上都注意到这个现象,所以尽管这个单词跟数值预测没有任何关系,但是仍然把这种方法称为回归. 二.线性回归 要了解回归方法,我

文华财经基本函数及语法

文华财经基本函数及语法 (2015-11-15 12:07:37) 转载▼   分类: Finance   编辑平台支持的操作符 操作符 意义 例 + 加法 CLOSE+OPEN 表示求收盘价及开盘价的和.CLOSE-OPEN 表示求收盘价及开盘价的差.CLOSE*OPEN 表示求收盘价及开盘价的积.CLOSE/OPEN 表示求收盘价及开盘价的商. - 减法 * 乘法 / 除法 && 与(并且) CLOSE>OPEN 表示判断当前周期是否收阳.CLOSE=OPEN 表示判断当前周期是

文华财经函数大全

文华财经函数大全 1.引用数据 AVPRICE 引用均价(在盘后对于国内三个期货交易所指结算价)SETTLE 引用结算价(如果用在周期小于'日'的K线上如5分钟K线,一小时k线,每根k线返回的值表示这根k线当日开盘时到这根k线的为止的结算价(均价)如果用在周期大于等于'日'的K线上,返回当根K线结束时间所在日的结算价.)CLOSE 引用收盘价(在盘中指最新价),也可简写为C.HIGH 引用最高价,也可简写为H.LOW 引用最低价,也可简写为L.OPEN 引用开盘价,也可简写为O.OPI 引用持仓

人工智能实验报告

课程名称: 人工智能         班级: 13 级计本     实验日期:   5 月5日 学号: 136201010496   姓名:  茅智强        成绩:  一.实验名称 线性回归预测系统 二.实验目的及要求 理解和掌握线性回归预测的基本方法,能够编程实现简单的线性回归预测系 统. 1.熟悉 Octave 编程语言: 2.线性回归预测函数.代价函数的设计和实现: 3.使用梯度下降算法进行参数学习 三.实验工具 Octave   notepad++ 四.实验内容与步骤 1.安装编

使用R语言预测产品销量

使用R语言预测产品销量 通过不同的广告投入,预测产品的销量.因为响应变量销量是一个连续的值,所以这个问题是一个回归问题.数据集共有200个观测值,每一组观测值对应一种市场情况. 数据特征 TV:对于一个给定市场的单一产品,用于电视上的广告费用(以千为单位) Radio:用于广告媒体上投资的广告费用 Newspaper:用于报纸媒体上的广告费用 响应 Sales:对应产品的销量 加载数据 > data <- read.csv("http://www-bcf.usc.edu/~garet