python中matplotlib实现最小二乘法拟合的过程详解

这篇文章主要给大家介绍了关于python中matplotlib实现最小二乘法拟合的相关资料,文中通过示例代码详细介绍了关于最小二乘法拟合直线和最小二乘法拟合曲线的实现过程,需要的朋友可以参考借鉴,下面来一起看看吧。

前言

最小二乘法Least Square Method,做为分类回归算法的基础,有着悠久的历史(由马里·勒让德于1806年提出)。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。

下面这篇文章主要跟大家介绍了关于python中matplotlib实现最小二乘法拟合的相关内容,下面话不多说,来一起看看详细的介绍:

一、最小二乘法拟合直线

生成样本点

首先,我们在直线 y = 3 + 5x 附近生成服从正态分布的随机点,作为拟合直线的样本点。

?


1

2

3

4

5

6

7

8

9

10

import numpy as np 

import matplotlib.pyplot as plt

 

# 在直线 y = 3 + 5x 附近生成随机点

X = np.arange(0, 5, 0.1

Z = [3 + 5 * x for x in X] 

Y = [np.random.normal(z, 0.5) for z in Z]

 

plt.plot(X, Y, ‘ro‘

plt.show()

样本点如图所示:

拟合直线

设 y = a0 + a1*x,我们利用最小二乘法的正则方程组来求解未知系数 a0 与 a1。

numpy 的 linalg 模块中有一个 solve 函数,它可以根据方程组的系数矩阵和方程右端构成的向量来求解未知量。

?


1

2

3

4

5

6

7

8

9

10

11

12

13

def linear_regression(x, y): 

 N = len(x)

 sumx = sum(x)

 sumy = sum(y)

 sumx2 = sum(x**2)

 sumxy = sum(x*y)

 

 A = np.mat([[N, sumx], [sumx, sumx2]])

 b = np.array([sumy, sumxy])

 

 return np.linalg.solve(A, b)

 

a0, a1 = linear_regression(X, Y)

绘制直线

此时,我们已经得到了拟合后的直线方程系数 a0 和 a1。接下来,我们绘制出这条直线,并与样本点做对比。

?


1

2

3

4

5

6

7

# 生成拟合直线的绘制点

_X = [0, 5

_Y = [a0 + a1 * x for x in _X]

 

plt.plot(X, Y, ‘ro‘, _X, _Y, ‘b‘, linewidth=2

plt.title("y = {} + {}x".format(a0, a1)) 

plt.show()

拟合效果如下:

二、最小二乘法拟合曲线

生成样本点

与生成直线样本点相同,我们在曲线 y = 2 + 3x + 4x^2 附近生成服从正态分布的随机点,作为拟合曲线的样本点。

?


1

2

3

4

5

6

7

8

9

10

import numpy as np 

import matplotlib.pyplot as plt

 

# y = 2 + 3x + 4x^2

X = np.arange(0, 5, 0.1

Z = [2 + 3 * x + 4 * x ** 2 for x in X] 

Y = np.array([np.random.normal(z,3) for z in Z])

 

plt.plot(X, Y, ‘ro‘

plt.show()

样本点如图所示:

拟合曲线

设该曲线的方程为 y = a0 + a1*x + a2*x^2,同样,我们通过正则方程组来求解未知量 a0、a1 和 a2。

?


1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

# 生成系数矩阵A

def gen_coefficient_matrix(X, Y): 

 N = len(X)

 m = 3

 A = []

 # 计算每一个方程的系数

 for i in range(m):

  a = []

  # 计算当前方程中的每一个系数

  for j in range(m):

   a.append(sum(X ** (i+j)))

  A.append(a)

 return A

 

# 计算方程组的右端向量b

def gen_right_vector(X, Y): 

 N = len(X)

 m = 3

 b = []

 for i in range(m):

  b.append(sum(X**i * Y))

 return b

 

A = gen_coefficient_matrix(X, Y) 

b = gen_right_vector(X, Y)

 

a0, a1, a2 = np.linalg.solve(A, b)

绘制曲线

我们根据求得的曲线方程,绘制出曲线的图像。

?


1

2

3

4

5

6

7

# 生成拟合曲线的绘制点

_X = np.arange(0, 5, 0.1

_Y = np.array([a0 + a1*x + a2*x**2 for x in _X])

 

plt.plot(X, Y, ‘ro‘, _X, _Y, ‘b‘, linewidth=2

plt.title("y = {} + {}x + {}$x^2$ ".format(a0, a1, a2)) 

plt.show()

拟合效果如下:

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对脚本之家的支持。

您可能感兴趣的文章:

原文链接:http://www.codebelief.com/article/2017/04/matplotlib-demonstrate-least-square-regression-process/

原文地址:https://www.cnblogs.com/judejie/p/8996088.html

时间: 2024-08-01 22:47:23

python中matplotlib实现最小二乘法拟合的过程详解的相关文章

Python中使用flask_sqlalchemy实现分页效果方法详解

Flask-sqlalchemy是关于flask一个针对数据库管理的.本文我们将采用一个关于员工显示例子,为大家展示分页效果的实现,一起来看看吧,希望对大家学习python有所帮助. 首先,我们创建SQLALCHEMY对像db. 1 from flask import Flask, render_template,request 2 from flask_sqlalchemy import SQLAlchemy 5 6 app = Flask(__name__,static_url_path='

Python中strip()、lstrip()、rstrip()用法详解

Python中有三个去除头尾字符.空白符的函数,它们依次为: strip: 用来去除头尾字符.空白符(包括\n.\r.\t.' ',即:换行.回车.制表符.空格)lstrip:用来去除开头字符.空白符(包括\n.\r.\t.' ',即:换行.回车.制表符.空格)rstrip:用来去除结尾字符.空白符(包括\n.\r.\t.' ',即:换行.回车.制表符.空格) 注意:这些函数都只会删除头和尾的字符,中间的不会删除. 用法分别为:string.strip([chars])string.lstrip

Python中str.format()字典及list传入详解

原文地址:https://www.cnblogs.com/qiaoxin/p/10109877.html

SVN中基于Maven的Web项目更新到本地过程详解

环境 MyEclipse:10.7 Maven:3.1.1 概述 最近在做项目的时候,MyEclipse下载SVN上面基于Maven的Web项目总是出现很多问题,有时候搞了很半天,Maven项目还是出现叉号,最后总结了方法步骤,终于可以将出现的问题解决,在此,将重现从SVN上将基于Maven的Web项目变成本地MyEclipse中项目的过程,问题也在其中进行解决. 问题补充 在使用Myeclipse的部署Web项目的时候,在点击部署按钮的时候,没有任何反应,在此提供两种解决方法,问题如图1所示:

49.Python使用requests包进行HTTP交互方法详解

简介 使用方法 传递QUERY参数 定制请求头 填写cookie 填充请求体 处理响应对象 重定向与访问历史 超时 Session对象 根据响应获取请求 SSL认证 HTTP认证 基本认证 摘要认证 代理场景 HTTPHTTPS代理 SOCKS代理 简介 Python的HTTP包有urllib.urllib2.httplib等,但是都需要了解较多的HTTP原理才能编码,借助requests包可以在较高的抽象层次上完成HTTP交互过程的开发.安装requests使用pip install requ

python编写微信公众号首图思路详解

前言 之前一直在美图秀秀调整自己的微信公众号首图,效果也不尽如人意,老是调来调去,最后发出来的图片被裁剪了一大部分,丢失部分关键信息,十分恼火,于是想着用python写一个程序,把微信公众号首图的模式固定下来,方便以后写公众号. 思路 根据微信公众号首图要求,可以上传一个不超过5M的图片,且图片尺寸要是2.35:1的尺寸,换算成像素是900:383,有了这些参数就可以做文章了,这里有两种思路 把今天推文的标题(文字)用图片展示出来,使得文字排列错落有致,简单粗暴,而又不失美感,这里可以利用mat

使用HeartBeat实现高可用HA的配置过程详解

使用HeartBeat实现高可用HA的配置过程详解 一.写在前面 HA即(high available)高可用,又被叫做双机热备,用于关键性业务.简单理解就是,有2台机器 A 和 B,正常是 A 提供服务,B 待命闲置,当 A 宕机或服务宕掉,会切换至B机器继续提供服务.常见的实现高可用的开源软件有 heartbeat 和 keepalived. 这样,一台 web 服务器一天24小时提供web服务,难免会存在 web 服务挂掉或服务器宕机宕机的情况,那么用户就访问不了服务了,这当然不是我们期望

加密 解密过程详解及openssl自建CA  

            加密 解密过程详解及openssl自建CA 为了数据信息能够安全的传输要求数据要有一定的安全性那么数据的安全性包含哪些方面的特性呢?    NIST(美国信息安全署)做了如下的定义:    保密性:       1,数据的保密性 指的是数据或隐私不向非授权者泄漏                   2,隐私性  信息不被随意的收集    完整性:       1,数据的的完整性:信息或程序只能被指定或授权的方式改变不能被随意的             修改        

Linux系统启动过程详解

 Linux系统启动过程详解 启动第一步--加载BIOS当你打开计算机电源,计算机会首先加载BIOS信息,BIOS信息是如此的重要,以至于计算机必须在最开始就找到它.这是因为BIOS中包含了CPU的相关信息.设备启动顺序信息.硬盘信息.内存信息.时钟信息.PnP特性等等.在此之后,计算机心里就有谱了,知道应该去读取哪个硬件设备了. 启动第二步--读取MBR众所周知,硬盘上第0磁道第一个扇区被称为MBR,也就是Master Boot Record,即主引导记录,它的大小是512字节,别看地方不大,