[R] 回归拟合

如下示例

> fit <- lm(y~x, data = data01)
> summary(fit)

Call:
lm(formula = data01$P ~ data01$M, data = data01)

Residuals:
    Min      1Q  Median      3Q     Max
-4.2070 -2.9109 -0.9089  2.9160  8.8993 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.340e+00  7.472e-01   8.485 4.26e-09 ***
x           1.305e-04  2.657e-05   4.911 3.87e-05 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 3.575 on 27 degrees of freedom
Multiple R-squared:  0.4718,    Adjusted R-squared:  0.4522
F-statistic: 24.11 on 1 and 27 DF,  p-value: 3.872e-05

Coefficients:

依次四个值是:

Estimate Std. Error t value Pr(>|t|)
估值,标准误差,T值,P值

其 中,我们可以直接通过P值与我们预设的0.05进行比较,来判定对应的解释变量的显著性(我们检验的原假设是,该系数是否显著为0,P<0.05则 拒绝原假设,即对应的变量显著不为0),我们可以看到截距项Intercept和X都可以认为是在P为0.05的水平下显著不为0,通过显著性检验

拟合优度R^2

我们看Multiple R-squared和Adjusted R-squared这两个值,其实我们常称之为“拟合优度”和“修正的拟合优度”,是指回归方程对样本的拟合程度几何,这里我们可以看到,修正的拟合优 度=0.4522,也就是大概拟合程度不到五成,表示拟合程度很一般。这个值当然是越高越好,当然,提升拟合优度的方法很多,当达到某个程度,我们也就认 为差不多了。具体还有很复杂的判定内容,有兴趣的可以看看:http://baike.baidu.com/view/657906.htm

F-statistic

我们常说的F统计量(F检验),常常用于判断方程整体的显著性检验,其P值为3.872e-05,显然是<0.05的,我们可以认为方程在P=0.05的水平上还是通过显著性检验的。

总结:
T检验是检验解释变量的显著性的;
R-squared是查看方程拟合程度的;
F检验是检验方程整体显著性的;

时间: 2024-10-06 05:58:05

[R] 回归拟合的相关文章

R语言实战(四)回归

本文对应<R语言实战>第8章:回归 回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量.效标变量或结果变量)的方法.通常,回归分析可以用来挑选与相应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量. 回归分析的各种变体 回归类型 用途 简单线性 用一个量化的解释变量预测一个量化的响应变量 多项式 用一个量化的解释变量预测一个量化的响应变量,模型的关系是n阶多项式 多元线性 用两个或多个量化的解释变量预测一个

SPSS—回归—二元Logistic回归案例分析

数据分析真不是一门省油的灯,搞的人晕头转向,而且涉及到很多复杂的计算,还是书读少了,小学毕业的我,真是死了不少脑细胞, 学习二元Logistic回归有一段时间了,今天跟大家分享一下学习心得,希望多指教! 二元Logistic,从字面上其实就可以理解大概是什么意思,Logistic中文意思为"逻辑"但是这里,并不是逻辑的意思,而是通过logit变换来命名的,二元一般指"两种可能性"就好比逻辑中的"是"或者"否"一样, Logis

数学建模:1.监督学习--回归分析模型

1.回归分析 在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间互相依赖的定量关系的一种统计分析方法. 按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析. 2.线性回归的python实现 线性回归的python实现方法 线性回归通常是人们在学习预测模型时首选的技术之一.在这种技术中,因变量是连续的,自变量可以是连续的也可以是离散的,回归线的性质是线性的. 线性回归使用最佳的拟合直线(也就是回归线)在因变量(Y)和一个或多个自变量(X)

【Python数据挖掘课程】九.回归模型LinearRegression简单分析氧化物数据

这篇文章主要介绍三个知识点,也是我<数据挖掘与分析>课程讲课的内容.同时主要参考学生的课程提交作业内容进行讲述,包括:        1.回归模型及基础知识:        2.UCI数据集:        3.回归模型简单数据分析. 前文推荐:       [Python数据挖掘课程]一.安装Python及爬虫入门介绍       [Python数据挖掘课程]二.Kmeans聚类数据分析及Anaconda介绍       [Python数据挖掘课程]三.Kmeans聚类代码实现.作业及优化 

使用tensorflow实现机器学习中的线性拟合

使用tensorflow实现机器学习中的线性拟合这个例子是模拟的单变量线性回归,通过提高单变量的阶数来增加特征数量,例如:4阶相当于分解为四个特征这种思想同样适用于多变量线性回归 import tensorflow as tf import numpy as np import matplotlib.pyplot as plt plt.rcParams['font.sans-serif']=['FangSong'] # 用来正常显示中文标签 plt.rcParams['axes.unicode_

R语言中多分类问题 multicalss classification 的性能测量

判别分析包括可用于分类和降维的方法.线性判别分析(LDA)特别受欢迎,因为它既是分类器又是降维技术.二次判别分析(QDA)是LDA的变体,允许数据的非线性分离.最后,正则化判别分析(RDA)是LDA和QDA之间的折衷. 本文主要关注LDA,并探讨其在理论和实践中作为分类和可视化技术的用途.由于QDA和RDA是相关技术,我不久将描述它们的主要属性以及如何在R中使用它们. 线性判别分析 LDA是一种分类和降维技术,可以从两个角度进行解释.第一个是解释是概率性的,第二个是更多的程序解释,归功于费舍尔.

线性回归的应用——容量预测

一个发展中的电信市场,网络容量往往是线性增加的,我们可以通过拟合历史网络容量指标,来判断未来网络规模,从而提前进行网络扩容,防患于未然. 线性回归实际上是找到一条直线,使得所有观测点y值到直线的离差平方和最小. 一.多元线性回归 多元线性回归使用矩阵方程可以很好的描述: 1. 拟合的p元线性方式格式 2. 回归拟合直线满足观测值与理论值离差平方和最小 3. 分别对p+1个因变量系数Beta求导,得到如下方程组 4. 进一步化简 5. 采用矩阵形式表示方程 6. 则方程系数如下 二.一元线性回归

百度数据挖掘笔试题

一.简答题(本题共30分) 1.如何理解继承.多态.组合,请举例说明它们的应用.(10分) 2.请列举出进程间通信的几种方式(至少列举出三种).(10分) 3.请写出贝叶斯公式,请描述朴素贝叶斯分类方法的原理和步骤.(10分) 二.算法与程序设计(本题共40分) 1.两个长度为100的随机向量X和Y,X=(x1,x2,x3,…,xn),Y=(y1,y2,y3,…,yn),其中xi和yi都是从均值为0,标准差为1的正态分布中随机选择的数,随机变量Z为X何Y的相关系数,请问: 1)Z的期望和标准差是

Python学习_科学计算

Python科学计算 包含Numpy.Matplotlib.Scipy.Pandas和scikit-learn 一.Numpy 1.Numpy特征和导入 (1)用于多维数组的第三方Python包 (2)更接近于底层和硬件 (高效) (3)专注于科学计算 (方便) (4)导入包:import numpy as np 2.list转为数组 (1)a = np.array([0,1,2,3]) (2)输出为:[0 1 2 3] (3)数据类型:<type 'numpy.ndarray'> 3.一维数