连续型变量的推断性分析——方差分析（2）

前面我们介绍了差异分解的方差分析思路，这是最初始的方差分析思想，随着线性模型的发展，人们又将线性模型的思想引入了方差分析，大大提升了这一分析方法的发展空间，下面我们来介绍一下线性模型在方差分析中的体现。任何一次实验结果都可以表示成如下形式:

Y_i=μ+ε_i

其中Y_i是第i次实验的实际结果，μ是该结果的最佳估计值，其实就是总体均值，ε_i是均值和实际结果的偏差也就是随机误差，为了方便推导，我们假定ε_i服从均值为0，标准差为某个定值的正态分布，这也是前面讲到的方差分析的适用条件之一。

我们把以上形式按照方差分析进行推广，假设我们要研究几种水平之间的差异，每种水平抽取一定样本并收集相关数据，那么模型公式可以表示为：

Y_ij=μ_i+ε_ij

其中Y_ij是第i组水平的第j个样本的实际结果，μ_i是第i组的均值，ε_ij是第i组第j个样本相对于实际结果的偏差。我们同样假定εi服从均值为0，标准差为某个定值的正态分布，如果这i组水平没有差异，则Y_ij应等于总体均值加上随机误差项。为了方便统计推断，我们又把模型公式改为如下形式：

Y_ij=μ+α_i+ε_ij

其中μ表示不考虑分组时的总体均值，α_i表示第i组的附加效应，即在第i组时的均值改变情况，例如

α_i=10，表示第i组的均值要比总体均值多10，如果这i组均值并无差异，那么α₁=α₂=α₃=.....=α_i，

反正则不等，据此我们可以建立假设：

H₀：i取任意值时，α_i=0
H₁：i取任意值时，至少有一个α_i<>0

结合差异分解的方差分析思路，我们发现α_i实际上就是处理因素导致的差异。

在多因素方差分析中，我们不但要考虑某个因素的影响，还要考虑多个因素之间的交互作用，因此模型公式还需要扩展，以两因素方差为例，模型公式为：

Y_ij=μ+α_i+β_j+γ_ij+ε_ijk

其中μ表示不考虑分组时的总体均值，
α_i表示第i组的附加效应
β_j表示第j组的附加效应
γ_ij表示两个因素的交互作用产生的效应

如果我们要分析αi对均值有无影响，需要以αi建立假设，即

H₀：i取任意值时，α_i=0
H₁：i取任意值时，至少有一个α_i≠0

如果我们要分析βj对均值有无影响，需要以βj建立假设，即
H₀：i取任意值时，β_j=0
H₁：i取任意值时，至少有一个β_j≠0

【线性模型的计算方法和差异分解的计算方法是一样的。】

时间： 2024-12-21 21:14:51

连续型变量分布