最小二乘拟合(转)

在物理实验中经常要观测两个有函数关系的物理量。根据两个量的许多组观测数据来确定它们的函数曲线,这就是实验数据处理中的曲线拟合问题。这类问题通常有两种情况:一种是两个观测量x与y之间的函数形式已知,但一些参数未知,需要确定未知参数的最佳估计值;另一种是x与y之间的函数形式还不知道,需要找出它们之间的经验公式。后一种情况常假设x与y之间的关系是一个待定的多项式,多项式系数就是待定的未知参数,从而可采用类似于前一种情况的处理方法。

一、最小二乘法原理

在两个观测量中,往往总有一个量精度比另一个高得多,为简单起见把精度较高的观测量看作没有误差,并把这个观测量选作x,而把所有的误差只认为是y的误差。设xy的函数关系由理论公式

y=fx;c1,c2,……cm           (0-0-1)

给出,其中c1,c2,……cm是m个要通过实验确定的参数。对于每组观测数据(xi,yii=1,2,……,N。都对应于xy平面上一个点。若不存在测量误差,则这些数据点都准确落在理论曲线上。只要选取m组测量值代入式(0-0-1),便得到方程组

                    yi=fx;c1,c2,……cm                    (0-0-2)

式中i=1,2,……,m.求m个方程的联立解即得m个参数的数值。显然N<m时,参数不能确定。

在N>m的情况下,式(0-0-2)成为矛盾方程组,不能直接用解方程的方法求得m个参数值,只能用曲线拟合的方法来处理。设测量中不存在着系统误差,或者说已经修正,则y的观测值yi围绕着期望值 <fx;c1,c2,……cm摆动,其分布为正态分布,则yi的概率密度为

,

式中 是分布的标准误差。为简便起见,下面用C代表(c1,c2,……cm)。考虑各次测量是相互独立的,故观测值(y1,y2,……cN)的似然函数

.

取似然函数L最大来估计参数C,应使

(0-0-3)

取最小值:对于y的分布不限于正态分布来说,式(0-0-3)称为最小二乘法准则。若为正态分布的情况,则最大似然法与最小二乘法是一致的。因权重因子 ,故式(0-0-3)表明,用最小二乘法来估计参数,要求各测量值yi的偏差的加权平方和为最小。

根据式(0-0-3)的要求,应有

从而得到方程组

(0-0-4)

解方程组(0-0-4),即得m个参数的估计值 ,从而得到拟合的曲线方程 

然而,对拟合的结果还应给予合理的评价。若yi服从正态分布,可引入拟合的x2量,

(0-0-5)

把参数估计 代入上式并比较式(0-0-3),便得到最小的x2

(0-0-6)

可以证明, 服从自由度v=N-mx2分布,由此可对拟合结果作x2检验。

x2分布得知,随机变量 的期望值为N-m。如果由式(0-0-6)计算出 接近N-m(例如 ),则认为拟合结果是可接受的;如果 ,则认为拟合结果与观测值有显著的矛盾。

二、直线的最小二乘拟合

曲线拟合中最基本和最常用的是直线拟合。设xy之间的函数关系由直线方程

y=a0+a1x                         (0-0-7)

给出。式中有两个待定参数,a0代表截距,a1代表斜率。对于等精度测量所得到的N组数据(xi,yi),i=1,2……,N,xi值被认为是准确的,所有的误差只联系着yi。下面利用最小二乘法把观测数据拟合为直线。

1.直线参数的估计

前面指出,用最小二乘法估计参数时,要求观测值yi的偏差的加权平方和为最小。对于等精度观测值的直线拟合来说,由式(0-0-3)可使

(0-0-8)

最小即对参数a(代表a0a1)最佳估计,要求观测值yi的偏差的平方和为最小。

根据式(0-0-8)的要求,应有

整理后得到正规方程组

解正规方程组便可求得直线参数a0a1的最佳估计值  。即

(0-0-10)

(0-0-11)

2.拟合结果的偏差

由于直线参数的估计值  是根据有误差的观测数据点计算出来的,它们不可避免地存在着偏差。同时,各个观测数据点不是都准确地落地拟合线上面的,观测值yi与对应于拟合直线上的 这之间也就有偏差。

首先讨论测量值yi的标准差S。考虑式(0-0-6),因等精度测量值yi所有的 都相同,可用yi的标准偏差S来估计,故该式在等精度测量值的直线拟合中应表示为

(0-0-12)

已知测量值服从正态分布时, 服从自由度v=N-2x2分布,其期望值

由此可得yi的标准偏差

(0-0-13)

这个表示式不难理解,它与贝塞尔公式是一致的,只不过这里计算S时受到两参数  估计式的约束,故自由度变为N-2罢了。

式(0-0-13)所表示的S值又称为拟合直线的标准偏差,它是检验拟合结果是否有效的重要标志。如果xy平面上作两条与拟合直线平行的直线

如图0-0-1所示,则全部观测数据点(xi,yi)的分布,约有68.3%的点落在这两条直线之间的范围内。

图0-0-1  拟合直线两侧数据点的分布

下面讨论拟合参数偏差,由式(0-0-10)和(0-0-11)可见,直线拟合的两个参数估计值  yi的函数。因为假定xI是精确的,所有测量误差只有yi有关,故两个估计参数的标准偏差可利用不确定度传递公式求得,即

把式(0-0-10)与(0-0-11)分别代入上两式,便可计算得

(0-0-14)

(0-0-15)

三、相关系数及其显著性检验

当我们把观测数据点(xi,yi)作直线拟合时,还不大了解xy之间线性关系的密切程度。为此要用相关系数ρx,y)来判断。其定义已由式(0-0-12)给出,现改写为另一种形式,并改用r表示相关系数,得

(0-0-16)

式中  分别为xy的算术平均值。r值范围介于-1与+1之间,即-1≤r≤1。当r>0时直线的斜率为正,称正相关;当r<0时直线的斜率为负,称负相关。当|r|=1时全部数据点(xi,yi)都落在拟合直线上。若r=0则x与y之间完全不相关。r值愈接近±1则它们之间的线性关系愈密切。

http://www.cnblogs.com/wenrenhua08/archive/2008/10/08/3993629.html

时间: 2024-11-05 12:30:02

最小二乘拟合(转)的相关文章

halcon之最小二乘拟合直线

如果不了解最小二乘算法 请先阅读: Least squares的算法细节原理https://en.wikipedia.org/wiki/Least_squares 通常在halcon中拟合直线会用houghline或者 fitline.本文提供一种新的选择,用halcon的矩阵操作实现最小二乘拟合直线 首先随机生成一组数据 Mx:=[100:10:500] tuple_length(Mx,len) tuple_gen_const(len,5,r) Ma:=2 Mb:=40 tuple_rand(

最小二乘拟合

拟合函数 function C = lspoly(X,Y,M) %This funciton implements the Least Squares Polynomial %By abcat at 2014.5.7 %Input -X is the 1*n abscissa vector % -Y is the 1*n ordinate vecotr % -M is the degree of the Least-Squares Polynomial %Output -C is the coe

非线性函数的最小二乘拟合——兼论Jupyter notebook中使用公式 [原创]

突然有个想法,利用机器学习的基本方法——线性回归方法,来学习一阶RC电路的阶跃响应,从而得到RC电路的结构特征——时间常数τ(即R*C).回答无疑是肯定的,但问题是怎样通过最小二乘法.正规方程,以更多的采样点数来降低信号采集噪声对τ估计值的影响.另外,由于最近在捣鼓Jupyter和numpy这些东西,正好尝试不用matlab而用Jupyter试试看.结果是意外的好用,尤其是在Jupyter脚本中插入LaTeX格式的公式的功能,真是太方便了!尝试了直接把纸上手写的公式转换到Jupyter脚本中的常

(十)最小二乘拟合二元直线

1 #encoding=utf-8 2 from matplotlib import pyplot as plt 3 import numpy as np 4 from mpl_toolkits.mplot3d import Axes3D 5 # 生成画布 6 fig = plt.figure(); 7 ax = Axes3D(fig); 8 9 point=[[2,3,48],[4,5,50],[5,7,51],[8,9,55],[9,12,56]]; 10 plt.xlabel("X1&qu

最小二乘拟合(scipy实现)

原文地址:https://www.cnblogs.com/hqczsh/p/11297669.html

基于EM的多直线拟合实现及思考

作者:桂. 时间:2017-03-22  06:13:50 链接:http://www.cnblogs.com/xingshansi/p/6597796.html 声明:欢迎被转载,不过记得注明出处哦~ 前言 分布拟合与曲线拟合系列本想简单梳理,却啰嗦的没完没了.本文主要介绍:多直线的拟合,多曲线可以依次类推.全文主要包括: 1)背景介绍 2)理论推导 3)代码实现 4)关于拟合的思考 内容多有借鉴他人,最后一并附上链接. 一.背景介绍 对于单个直线,可以借助MLE或者最小二乘进行求参,对于多条

最小二乘法拟合非线性函数及其Matlab/Excel 实现(转)

1.最小二乘原理 Matlab直接实现最小二乘法的示例: close x = 1:1:100; a = -1.5; b = -10; y = a*log(x)+b; yrand = y + 0.5*rand(1,size(y,2)); %%最小二乘拟合 xf=log(x); yf=yrand; xfa = [ones(1,size(xf,2));xf] w = inv(xfa*xfa')*xfa*yf';%直接拟合得到的结果 参考资料: 1.http://blog.csdn.net/lotus_

最小二乘法拟合圆

有一系列的数据点 {xi,yi}.我们知道这些数据点近似的落在一个圆上.依据这些数据预计这个圆的參数就是一个非常有意义的问题.今天就来讲讲怎样来做圆的拟合.圆拟合的方法有非常多种,最小二乘法属于比較简单的一种. 今天就先将这样的. 我们知道圆方程能够写为: (x?xc)2+(y?yc)2=R2 通常的最小二乘拟合要求距离的平方和最小.也就是 f=∑((xi?xc)2+(yi?yc)2??????????????????√?R)2 最小. 这个算起来会非常麻烦. 也得不到解析解. 所以我们退而求其

OpenCV 学习(直线拟合)

OpenCV 学习(直线拟合) Hough 变换可以提取图像中的直线.但是提取的直线的精度不高.而很多场合下,我们需要精确的估计直线的参数,这时就需要进行直线拟合. 直线拟合的方法很多,比如一元线性回归就是一种最简单的直线拟合方法.但是这种方法不适合用于提取图像中的直线.因为这种算法假设每个数据点的X 坐标是准确的,Y 坐标是带有高斯噪声的.可实际上,图像中的每个数据点的XY 坐标都是带有噪声的. 下面就来讲讲适用于提取图像中直线的直线拟合算法. 一个点 (xi,yi) 到直线的距离用 ri 来