EXCEL回归分析
通过数据间的相关性,我们可以进一步构建回归函数关系,即回归模型,预测数据未来的发展趋势。
相关分析与回归分析的联系是:均为研究及测量两个或两个以上变量之间关系的方法。在实际工作中,一般先进行相关分析,计算相关系数,
然后拟合回归模型,进行显著性检验,最后用回归模型推算或预测。
- 简单线性回归
简单线性回归也称为一元线性回归,也就是回归模型中只含有一个自变量。 - 实验目的:以“企业季度数据”为例,先撇开其他费用因素,只考虑推广费用对销售额的影响,如果确定了2012年第3季度推广费用的预算,通过以上数据,
如何预测2012年第3季度销售额呢? - 绘制散点图
按照回归分析步骤,确定好因变量与自变量后,需绘制销售额(Y)与推广费用(X1)的散点图。
一般在做线性回归之前,需要先用散点图查看数据之间是否有线性分布特征,只有当数据具有线性分布特征时,
才能采用线性回归分析方法。图1-1 销售额与推广费用散点图关系
通过散点图能够直观看出推广费用与销售额之间有一定的线性分布特征,我们可以利用Excel图表工具为其添加趋势线。
图1-2 【设置趋势线格式】
得到一条拟合直线,拟合曲线方程为Y=1.198X + 4361.5, R^2=0.9055
现在,我们通过绘图方式建立回归分析模型,后续需要进一步使用多个统计指标来检验,如回归模型的拟合优度检验(R^2)、
回归模型的显著性检验(F检验)、回归模型的显著性检验(t检验)等综合评估回归模型的优劣。 -
图1-3 简单线性回归参数设置
- 标准残差:(残差-残差的均值)/残差的标准差。
- 残差:指观测值与预测值(拟合值)之间的差,也称剩余值。
残差图:以回归模型的自变量为横坐标,以残差为纵坐标绘制的散点图。若绘制的点都在以0为横轴的直线上下随机散布,则表示
拟合合理,否则需要重新建模。
线性拟合图:以回归模型的自变量为横坐标,以因变量及预测值为纵坐标绘制的散点图。
正态概率图:以因变量的百分位排名为横坐标,以因变量的作为纵坐标绘制的散点图。图1-4 简单线性回归结果
通过Excel分析工具库中的"回归"分析工具,我们可以了解到更多的信息,如回归统计表、方差分析表、回归系数表这三张表就分别用于回归模型的拟合优度检验(R^2)、回归模型的显著性检验(F检验)、回归系数的显著性检验(t检验)。
- 回归统计表
回归统计表主要用于衡量因变量Y与自变量X之间相关程度的大小,以及检验样本数据点聚集在回归直线周围的密集程度,从而评价
回归模型对样本数据的代表程度,即回归模型的拟合效果。 - 方差分析
方差分析表主要作用是通过F检验来判断回归模型的回归效果,即检验因变量与所有自变量之间的线性关系是否显著,用线性模型
来描述他们之间的关系是否恰当。主要有Df-自由度、SS-误差平方和、MS-均方差、F统计量、Significance F (P值)五大指标。
(1)F:F统计量,用于衡量变量间线性关系是否显著。
(2)Significance F:是统计学常说的P值。一般我们以此来衡量检验结果是否具有显著性, - 如果P值>0.05,则结果不具有显著的统计学意义;
如果0.01<P值<=0.05,则结果具有显著的统计学意义;如果P<=0.01,则结果具有极其显著的统计学意义。 - 回归系数表
回归系数表主要用于回归模型的描述和回归系数的显著性检验。回归系数的显著性检验,即研究回归模型中的每个自变量与因变量之间是否存在显著的线性关系,也就是研究自变量能否有效地解释因变量的线性变化,他们能否保留在线性回归模型中。通过以上数据分析,我们得到如下结论:
(1)最终我们得到的销售额和推广费用的简单线性回归模型为Y=4361.4864+1.1980X,其中判定系数R^2=0.9055,回归模型拟合效果较好。 - (2)回归模型的F检验与回归系数的t检验相应的P值都远小于0.01,具有显著性线性关系。综合来说,回归模型拟合较好。
(3)我们将制定的2012年第3季度的推广预算值代入回归模型,就可以预测2012年第3季度的销售额。
原文地址:https://www.cnblogs.com/xuxaut-558/p/10285700.html
时间: 2024-10-02 16:45:23