线性回归——简单线性回归

给定数据集，其中。线性回归试图学得一个线性模型以尽可能准确线性回归试图学得一个线性模型以尽可能准确地预测实值输出标记。（注：上面的以及均表示向量；的取值表示在向量上的第d个属性）

先考虑最简单的情形（简单线性回归）：输入属性的数目只有一个。简单线性回归线性回归试图学得

，使得

我们可以通过使均方误差最小化来求w和b，即

均方误差对应了常用的欧氏距离。基于均方误差最小化来进行模型求解的方法成为“最小二乘法”。在线性回归中，最小二乘法就是试图找到一条直线，使所有样本到直线上的欧式距离之和最小。

令，分别对w和b求偏导，可得：

这里是凸函数，当它关于w和b的导数均为0时得到w和b的最优解。令上面的偏导为0可得：

，其中

通过上式，可算出：

这就表明，在简单线性回归中，对应属性数目只有一个（也就是二维）时，最优解w是所有纵坐标之和除以所有横坐标之和。最优解b是在该w之下，数据集中所有点对应截距总和的平均值（即每个点在该w之下会有一个自己的截距，求出所有点的对应截距再求和，最后平均之后作为最优的截距）。

参考资料：机器学习（周志华版）

注：上述公式都可以简单推导出来，书中给出的w是上面的复杂的公式，在推到过程中可以不必太在意这个公式，直接结合求出的w和b的公式，联合方程组就可以求出上面那个简洁的w公式。个人认为这里推出的w很漂亮，因为很容易理解，算是第一次粗略地感受到数学之美。后续还会写一篇多元线性回归的博文，希望也可以做一个很好的解释。

时间： 2024-12-08 22:12:39

线性回归——简单线性回归的相关文章

简单线性回归

协方差:两个变量总体误差的期望. 简单的说就是度量Y和X之间关系的方向和强度. X :预测变量Y :响应变量 Y和X的协方差:［来度量各个维度偏离其均值的程度］备注:［之所以除以n-1而不是除以n,是因为这样能使我们以较小的样本集更好的逼近总体的协方差,即统计上所谓的"无偏估计".而方差则仅仅是标准差的平方］如果结果为正值,则说明两者是正相关的(从协方差可以引出"相关系数"的定义), 如果结果为负值就说明负相关的如果为0,也是就是统计上说的"相互独立

简单线性回归算法

/** * 简单线性回归算法 * @param array y轴数据 * @param array x轴数据 * @returns array(slope,intercept,r2) */ function linearRegression(y, x) { var lr = {}; var n = y.length; var sum_x = 0; var sum_y = 0; var sum_xy = 0; var sum_xx = 0;

SPSS数据分析—简单线性回归

和相关分析一样,回归分析也可以描述两个变量间的关系,但二者也有所区别,相关分析可以通过相关系数大小描述变量间的紧密程度,而回归分析更进一步,不仅可以描述变量间的紧密程度,还可以定量的描述当一个变量变化时,对另一个变量的影响程度,这是相关分析无法做到的,正因为如此,回归分析更多用来预测和控制变量值,但是回归分析并不等同于因果关系. 根据模型的不同可以分为线性回归和非线性回归线性回归分析一般用线性模型来描述,和方差分析模型一样,只是各部分的叫法有所不同,回归模型分为常量.回归部分.残差常量就是所谓

sklearn学习笔记之简单线性回归

简单线性回归线性回归是数据挖掘中的基础算法之一,从某种意义上来说,在学习函数的时候已经开始接触线性回归了,只不过那时候并没有涉及到误差项.线性回归的思想其实就是解一组方程,得到回归函数,不过在出现误差项之后,方程的解法就存在了改变,一般使用最小二乘法进行计算. 使用sklearn.linear_model.LinearRegression进行线性回归 sklearn对Data Mining的各类算法已经有了较好的封装,基本可以使用fit.predict.score来训练.评价模型,并使用模型进

机器学习六--回归--简单线性回归Simple Linear Regression

一.回归和分类回归(regression)y变量为连续数值型(continuous numerical variable),如房价,降雨量. 分类(classification)y变量为类别型categorical variable.如颜色类别,电脑品牌等. 二.统计量:描述数据特征 2.1集中趋势衡量:均值(mean),中位数,众数. 2.2离散程度衡量:方差标准差S 三.简单线性回归介绍 1.简单线性回归包含一个自变量(x)和一个因变量(y) 2.以上两个变量的关系用一条直线

机器学习与Tensorflow（1）——机器学习基本概念、tensorflow实现简单线性回归

一.机器学习基本概念 1.训练集和测试集训练集(training set/data)/训练样例(training examples): 用来进行训练,也就是产生模型或者算法的数据集测试集(testing set/data)/测试样例 (testing examples):用来专门进行测试已经学习好的模型或者算法的数据集 2.特征向量特征向量(features/feature vector):属性的集合,通常用一个向量来表示,附属于一个实例 3.分类问题和回归问题分类 (classific

ML_简单线性回归

1. 前提介绍: 为什么需要统计量? 统计量:描述数据特征 1.1 集中趋势衡量 1.1.1 均值(平均数.平均值)(mean) {6 2 9 1 2} (6+2+9+1+2)/5=4 1.1.2 中位数(medain):将数据中的各个数值按照大小顺序排列,居于中间位置的变量 1.1.3 众数(mode):数据中出现次数最多的数 1.2 1.2.1 离散程度衡量 1.2.1.1 方差(variance) 1.2.1.2 标准差(standard deviation) 1. 介绍:回归(regr

机器学习-简单线性回归(二)

一.简单线性回归模型举例汽车卖家做电视广告数量与卖出去的汽车数量: 1.1 列出适合简单线性回归模型的最佳回归线? 使sum of squares最小 1.2 计算 1.3 预测假设有一周的广告数为6.预测的汽车销售量为多少? 代码: # -*- coding:utf-8 -*- #简单线性回归:只有一个自变量 y=k*x+b 预测使得(y-y*)^2最小 import numpy as np def fitSLR(x, y): n = len(x) dinominator = 0 #分母

03_有监督学习--简单线性回归模型（调用 sklearn 库代码实现）

有监督学习--简单线性回归模型(调用 sklearn 库代码实现)0.引入依赖1.导入数据(data.csv)2.定义损失函数3.导入机器学习库 sklearn4.测试:运行算法,从训练好的模型中提取出系数和截距5.画出拟合曲线6.附录-测试数据有监督学习--简单线性回归模型(调用 sklearn 库代码实现) 0.引入依赖 import numpy as npimport matplotlib.pyplot as plt 1.导入数据(data.csv) points = np.genfro

猜你喜欢

TCP/IP协议——ARP详解（转载）

本文主要讲述了ARP的作用.ARP分组格式.ARP高速缓存.免费ARP和代理ARP. 1.学习ARP前要了解的内容建立TCP连接与ARP的关系应用接受用户提交的数据,触发TCP建立连接,TCP的第 ...

python 局部变量和全局变量 global

当你在函数定义内声明变量的时候,它们与函数外具有相同名称的其他变量没有任何关系,即变量名称对于函数来说是局部的.这称为变量的作用域 .所有变量的作用域是它们被定义的块,从它们的名称被定义的那点开 ...

java文件遍历

用java实现本地文件的遍历,顺便了解了下集合框架,注意java中还有Collections,是一个强大的工具,注意其与Collection的区别,在 for(File f: listFiles) 中 ...

vue调试工具vue-devtools安装及使用

本文主要介绍 vue的调试工具 vue-devtools 的安装和使用工欲善其事, 必先利其器, 快快一起来用vue-devtools来调试开发你的vue项目吧安装: 1.到github下载: ...

pxe装机

Pxe装机准备:1,在VMware中安装了一个CentOS63(CentOS6.4系统,IP :192.168.202.131)2,在VMware中创建了一个CentOS65(空机器,未装操作系统) ...

Linux UTC时间与本地时间

因为维护的机器有欧洲,有越南,有泰国,有北美,有台湾,有大陆的机器. 但有个脚本需要告警, 告警的时间都要统一为大陆的时间. UTC时间与本地时间 UTC + 时区差 = 本地时间时区差东为正,西为 ...

搞不清FastCgi与PHP-fpm之间是个什么样的关系

https://segmentfault.com/q/1010000000256516 我在网上查fastcgi与php-fpm的关系,查了快一周了,基本看了个遍,真是众说纷纭,没一个权威性的定义. ...

Codeforces_429_B

http://codeforces.com/problemset/problem/429/B 挺简单的题,先求出四个点到每一点的最大和,然后枚举每一点,取和最大值. 注意两条路相交的点有且只有一个,这 ...

关于exchange使用foxmail下的pop3无法发送邮件exchange模式正常

这个问题也可以称呼为Exchange 中如何授予邮箱的代理发送权限今天有一个客户遇到了下面的问题.之后他找了网络上很多资料,都没能解决问题.我现在分享一下解决方法. 使用exchange或者foxm ...

xdebug

<?php//测试脚本头文件// cpu:XHPROF_FLAGS_CPU 内存:XHPROF_FLAGS_MEMORY // 如果两个一起:XHPROF_FLAGS_CPU + ...

Linux 3.16 release 贡献度

内核 3.16 release 的贡献度可以在下面网页看到: http://www.remword.com/kps_result/3.16_whole.html 一共发布了 12802 个补丁, 18 ...

linux重要目录详细说明

一级目录: /bin 存放系统命令和工具.二进制命令 (相当于C:\WINDOWS\system32) /boot 包含linux系统的启动引导文件和 ...

gdb篇

转自:http://www.cnblogs.com/ypchenry/p/3668572.html 1.gdb的原理熟悉linux的同学面试官会问你用过gdb么?那好用过,知道gdb是怎么工作的么? ...

Intel HD Graphics 620 (华硕FL5900U) Windows7下安装显卡驱动

我们的牙膏大厂Intel,不但会挤牙膏,现在连驱动也不给你用了.KabyLake也就是第七代酷睿处理器,集成了Intel HD Graphics 620核显,核显(显卡)驱动程序只支持到Win10这一 ...

继承，基类，派生类

在 C++中,继承机制通过类的派生实现,被继承的类称为基类或父类:在继承类的基础上创建的新类称为派生类或子类.派生类的定义格式为:class 派生类名:继承方式基类名 1,继承方式基类名 2,…,继承 ...

C++11 并发编程基础（一）：并发、并行与C++多线程

正文 C++11标准在标准库中为多线程提供了组件,这意味着使用C++编写与平台无关的多线程程序成为可能,而C++程序的可移植性也得到了有力的保证.另外,并发编程可提高应用的性能,这对对性能锱铢必较的C ...

第二章变量,数据类型和运算符

第二章 &变量,数据类型和运算符英文新识: double 双精度浮点 string 字符串 character 字母 integer 整数 Scanner 扫描仪 score 分数 ...

IOS开发UI基础 UIAlertView的属性

UIAlertView1.Title获取或设置UIAlertView上的标题. 2.Message获取或设置UIAlertView上的消息 UIAlertView *alertView = [[UIA ...

Linux下wps字体问题

1.安装symbol-fonts_1.2_all.deb,自行搜索 2.卸载xfonts-mathml字体 sudo apt-get remove xfonts-mathml

SDK及工具类型的网站整理

1.收集整理Android开发所需的Android SDK.开发中用到的工具.Android开发教程.Android设计规范,免费的设计素材等,无需翻墙,就可下载 http://www.android ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.