1.定义:
利用已有样本,产自拟合方程,从而对(未知数据)进行预测。
2.用途:
预测,合理性判断。
3.分类:
线性回归分析:一元线性回归,多元线性回归,广义线性(将非线性转化为线性回归,logic回归)
非线性回归分析
4.困难:
变量选取,多重共线性,观察拟合方程,避免过度拟合
5.关系:
函数关系:确定性关系,y=a*x+b
相关关系:非确定性关系
相关系数:正数为正相关(同增同长),负数为负相关(同增同减)
6.一元线性回归模型:
1) 若X与Y间存在着较强的相关关系,则我们有Y≈a+bX
2) 若a不b的值已知,则给出相应的X值,我们可以根据Y≈a+bX得到相应的Y的预测值
7.参数:
Y=a+bx+e,a为截距,b为斜率,e为误差项。
8.确定参数:使用平方误差和衡量预测值不真实值的差距
最小二乘法:
RSS其实是关于a与b的函数:
9.一元线性回归分析:
1)原理,最小二乘法
2)步骤:建立回归模型,求解回归模型中的参数,对回归模型迚行检验
10.R分析:
1)输入数据
2)建立模型:z=lm(y~x+1)/lm(y~x)表示有截距,z=lm(y~x-1)/lm(y~x+0)/lm(y~x-0)表示没有截距通过原点。
3)plot(z)输出散点图
4)summary(z),输出结果。
5)plot(z)输出各种图。
11.其他一些R函数:
建立模型:z=lm(y~x+1)/lm(y~x)表示有截距,z=lm(y~x-1)/lm(y~x+0)/lm(y~x-0)表示没有截距通过原点。
plot(z)输出散点图
方差分析,anova()
作出预测,predict(a,z)
打印模型信息print(a)
计算残差residuals(a)
计算残差平方和deviance(a)
提取模型公式formula(a)
求模型系数coef(a)
时间: 2024-10-11 00:17:49