1. 前提介绍:
为什么需要统计量?
统计量:描述数据特征
1.1 集中趋势衡量
1.1.1 均值(平均数、平均值)(mean)
{6 2 9 1 2}
(6+2+9+1+2)/5=4
1.1.2 中位数(medain):将数据中的各个数值按照大小顺序排列,居于中间位置的变量
1.1.3 众数(mode):数据中出现次数最多的数
1.2
1.2.1 离散程度衡量
1.2.1.1 方差(variance)
1.2.1.2 标准差(standard deviation)
1. 介绍:回归(regression)Y变量为连续数值型(continuous numerical variable)
如:房价,人数,降雨量
分类(classification):Y变量为类别型(categorical variable)
如:颜色类别,电脑品牌,有无信誉
2. 简单线性回归(Simple Linear Regression)
2.1很多做决定的过程通常是根据两个或多个变量之间的关系
2.2 回归分析(regression analysis)用来建立方程模拟两个或多个变量之间如何关联
2.3 被预测的变量叫做:因变量(dependent variable),y,输出(output)
2.4 被用来进行预测的变量叫做:自变量(independent variable),x,输入(input)
3. 简单线性回归介绍
3.1 简单线性回归包含一个自变量(x)和一个因变量(y)
3.2 以上两个变量的关系用一条直线来模拟
3.3 如果包含两个以上的自变量,则称作多元回归分析(multiple regression)
4. 简单线性回归模型
4.1 被用来描述因变量(y)和自变量(x)以及偏差(error)之间关系的叫做回归模型
4.2 简单线性回归的模型是:
5. 简单线性回归方程
6.正向线性关系:
7. 负向线性关系:
8. 无关系:
9. 估计的简单线性回归方程
10.
原文地址:https://www.cnblogs.com/wuweixiong/p/10446350.html