数据分析中几个评估参数

在统计学中对变量进行线行回归分析,采用最小二乘法进行参数估计,在数据分析中通常会通过评估参数来评估我们得出的模型对结果的拟合度,通常会用到的参数有:

最小二乘法:我们将预测值与实际值之间的差值进行求平方和,这个和我们叫离差平方和,使离差平方和最小的方法叫“最小二乘法”

1、SSE(误差平方和):the sum of squares due to error

2、MSE(均方误差平方和): Mean squares error

3、RMSE(均方根误差平方和): Root mean squares error

4、R-square(确定系数 也叫R^2): cofficient of detrmination

下面对以上几个参数进行总结:

1)SSE(误差平方和)

该统计参数计算的是拟合数据和原始数据对应点的误差平方和,计算公式如下:

SSE=Σ(Y^-Y)^2

SSE越趋近于0,说明模型选择的拟合度越好,预测结果越好。RMSE和MSE的一样也是越趋近于0,模型选择的拟合度越好。

2)MSE(均方误差平方和)

该统计参数计算的是拟合数据和原始数据对应点的误差平方和的均值,即SSE/N (N为样本数):

MSE=SSE/n=Σ(Y^-Y)^2/n

3)RMSE(均方根)

该参数也是回归系统的拟合标准差,即MSE的平方根,

总结:SSE、MSE、RMSE都是原始值与预测值之间的残差平方关系,表现回归中预测值的好坏,这些参数越趋近于0,得出的预测值越好!

4) R-square(确定系数)即R^2

了解确定系数钱,我们先看另外连个参数SSR和SST,因为确定系数由他们两个确定:

(1)SSR:sum of squares of regession,即预测数据与原始数据均值之差的平方和:

(2)SST:Total sum of squares 即原始数据和均值之差的平方和:

我们可以看出SST=SSE+SSR,而我们的R^2(确定系数)为SSR/SST

R^2=SSR/SST=SST-SSE/SST=1-SSE/SST

总结:

1)、R^2:决定系数,反映因变量的全部变化能通过回归关系被自变量解释的比例

2)、R^2 是非负统计量

3)、R^2的取值范围为0~1,R^2的值越趋近于1表示得出的模型对原始数据的因变量解释下越好,反之越差!

4)、R^2是样本观测值的函数,可决定系数R^2是随着抽样变动而随机变动,为此要对R^2的统计可靠性进行检验。

原文地址:https://www.cnblogs.com/dushangguzhousuoli/p/10069546.html

时间: 2024-10-11 04:28:35

数据分析中几个评估参数的相关文章

APP数据分析中的转化统计技巧

APP运营过程中要监控和收集大量的数据,当数据积累到一定量,就可以进行数据分析,为最终的用户转化和收益变现做理论基础.在一个APP里面,可以用来进行转化分析的数据非常多,细致到每一个点击,每一次触发都可以作为数据上传到监控后台.当然,企业没有如此多的资源来分析每一个数据,那么哪些用户行为是评价用户转化中最关键的参数呢? 用户打开一个APP,首先要做的就是浏览内容,阅读其中的信息.如果用户打开APP后什么内容都没有阅读就离开了,那这个用户后续的转化可能性也是微乎其微.用户阅读过内容后,如果觉得这些

scikit-learn 中常用的评估模型

一,scikit-learn中常用的评估模型 1.评估分类模型: ? 2.评估回归模型: ? 二.常见模型评估解析: ?对于二分类问题,可将样例根据其真实类别和分类器预测类别划分为:(T,F表示预测的正确与错误性,P,N表示预测的正类和负类) ?真正例(TruePositive,TP):真实类别为正例,预测类别为正例. ?假正例(FalsePositive,FP):真实类别为负例,预测类别为正例. ?假负例(FalseNegative,FN):真实类别为正例,预测类别为负例. ?真负例(True

PHP中$_SERVER的详细参数与说明

PHP编程中经常需要用到一些服务器的一些资料,特把$_SERVER的详细参数整理下,方便以后使用. $_SERVER['PHP_SELF'] #当前正在执行脚本的文件名,与 document root相关. $_SERVER['argv'] #传递给该脚本的参数. $_SERVER['argc'] #包含传递给程序的命令行参数的个数(如果运行在命令行模式). $_SERVER['GATEWAY_INTERFACE'] #服务器使用的 CGI 规范的版本.例如,"CGI/1.1". $_

javascript中所有函数的参数都是按值传递的

[javascript中所有函数的参数都是按值传递的] 参考:http://www.jb51.net/article/89297.htm

【php】php中获取任意个参数

本文与<[Servlet]Javaweb中获取任意个参数>(点击打开链接)为姊妹篇, 如果你有时候需要通过get方法在php页面之间传递不定个参数,该怎么实现呢? 比如如下的效果,无论通过get方法,给numUndefindParameter.php这个页面传递任意个参数,它都能正常获取. 当然,一般不推荐这样做,建议还是用<[php]基本语法与页面之间数值传递>(点击打开链接)早已说过的,非常著名的$_REQUEST["某某某参数"];的做法. 本方法,主要是

关于linux /etc/sysconfig/network中的NOZEROCONF=yes参数

今天从CSSD Fails to Join the Cluster After Private Network Recovered if avahi Daemon is up and Running (Doc ID 1501093.1)文章中看到了这个参数, 在该文章中,有如下的论述: Solution The solution is to shutdown and disable 3rd party zeroconf mDNS process, in this case, avahi-daem

boost在lambda表达式中调用占位符参数的成员函数的方法

boost中提供了lambda表达式的用法,但是lambda表达式的功能还不是很强大,在其中只能对lambda的占位符参数_1等使用最基本的操作符,如+-*/,可是很多时候如果传入的占位符参数是一个对象指针的话,我们可能想要调用这个类的成员函数. 我在开发中遇到了这个问题,需要在stl的算法中传入一个函数来调用对象的比较函数,因为感觉这样太麻烦,还需要重新定义一个函数,所以想起了lambda表达式,c++11的lambda表达式我倒是没试过,可是受项目开发环境所限,只能选择boost.但是我用的

漫谈redis在运维数据分析中的去重统计方式

今天,我和大家分享下redis在运维数据分析中的去重统计方式.为了避免混淆,本文中对于redis的数据结构做如下约定: SET:saddkey member ZSET:zaddkeyscoremember HYPERLOGLOG:pfaddkeyelement STRING:setbitkeyoffset value 名词约定: 维度:比如版本.操作系统类型.操作系统版本.运营商.设备型号.网络类型等 复合维度:由两个或多个维度交错产生的维度,比如某个版本下的某个设备型号. 去重统计在数据化运维

MSSQL中存储过程的可选参数的定义和使用

可选参数的存在,可以极大的降低代码的重复冗余.在数据库开发中,也是如此.现在针对MSSQL中存储过程的可选参数的定义和使用进行基本的介绍,留作备忘. #准备工作: 在db_test中建立一张测试表T_test: USE db_test; CREATE TABLE dbo.T_test ( Id  INT  IDENTITY(1,1) NOT NULL ,Name  NVARCHAR(20)  NOT NULL ,Sex  BIT  DEFAULT(0) ); 插入一些数据: INSERT INT