关于正态总体的样本均值与样本方差的重要结论

概要

这些结论为参数的假设检验提供了理论基础,非常重要。参考《概率论与数理统计》记录一下。

?


重要定理

?
?? 设 \(x_1,\cdots, x_n\) 是来自正态总体 \(N(\mu, \sigma^2)\) 的样本,其样本均值和样本方差分别为
\begin{align}
\bar{x} &= \frac{1}{n} \sum_{i=1}^n x_i \\
s^2 &= \frac{1}{n-1} \sum_{i=1}^n(x_i - \bar{x})^2
\end{align}
则有

  1. \(\bar{x}\) 与 \(s^2\) 相互独立
  2. \(\bar{x} \sim N(\mu, \dfrac{\sigma^2}{n})\)
  3. \(\frac{(n-1)s^2}{\sigma^2}\sim \mathcal{X}^2(n-1)\)

??证明: 记 \(x=(x_1,\cdots,x_n)^T\),则有
\begin{align}
E(X) = \begin{bmatrix} \mu \\ \vdots \\ \mu \end{bmatrix}, \quad Var(X) = \sigma^2 I
\end{align}
取一个 \(n\) 维正交矩阵 \(A\),其第一行的每一个元素均为 \(1 / \sqrt{n}\),如
\begin{align}
A = \begin{bmatrix} \dfrac{1}{\sqrt{n}} & \dfrac{1}{\sqrt{n}} & \dfrac{1}{\sqrt{n}} & \cdots & \dfrac{1}{\sqrt{n}} \\
\dfrac{1}{\sqrt{2\cdot 1}} & -\dfrac{1}{\sqrt{2\cdot 1}} & 0 & \cdots & 0 \\
\dfrac{1}{\sqrt{3\cdot 2}} & \dfrac{1}{\sqrt{3 \cdot 2}} & -\dfrac{2}{\sqrt{3\cdot 2}} & \cdots & 0 \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
\dfrac{1}{\sqrt{n(n-1)}} & \dfrac{1}{\sqrt{n(n-1)}} & \dfrac{1}{\sqrt{n(n-1)}} & \cdots & -\dfrac{n-1}{\sqrt{n(n-1)}} \\
\end{bmatrix}
\end{align}
令 \(Y=AX\),则由多维正态分布的性质知 \(Y\) 仍服从 \(n\) 维正态分布,其均值和方差分别为
\begin{align}
E(Y) &= A \cdot E(X) = \begin{bmatrix} \sqrt{n} \mu \\ 0 \\ \vdots \\ 0 \end{bmatrix} \\
Var(Y) &= A\cdot Var(X) \cdot A^T = A \cdot \sigma^2 I \cdot A^T = \sigma^2 AA^T = \sigma^2 I
\end{align}
所以 \(Y=(y_1,\cdots,y_n)^T\) 的各个分量相互独立,且都服从正态分布,其方差均为 \(\sigma^2\),而均值并不完全相同,\(y_1\) 的均值为 \(\sqrt{n}\mu\),而 \(y_2 ,\cdots, y_n\) 的均值为 \(0\)。注意到 \(\bar{x}=\dfrac{1}{\sqrt{n}}y_1\),这就证明了结论 2.

由于 \(\sum_{i=1}^n y_i^2 = Y^TY = X^TA^TAX=\sum_{i=1}^n x_i^2\),故而
\begin{align}
(n-1)\cdot s^2 &= \sum_{i=1}^n (x_i-\bar{x})^2 = \sum_{i=1}^n x_i^2 - (\sqrt{n}\bar{x})^2 \\
&=\sum{i=1}^n y_i^2-y_1^2=\sum_{i=2}^n y_i^2
\end{align}
这就证明了结论 1.

由于 \(y_2,\cdots, y_n\) 独立同分布于 \(N(0,\sigma^2)\),于是
\begin{align}
\frac{(n-1)s^2}{\sigma^2} = \sum_{i=2}^n \left(\frac{y_i}{\sigma} \right)^2 \sim \mathcal{X}^2(n-1)
\end{align}
定理证明完成。
?


重要推论

?
??推论 1: 在上述定理的记号下,有:
\begin{align} \label{e1}
t = \frac{\sqrt{n}(\bar{x}-\mu)}{s} \sim t(n-1)
\end{align}
??证明:由上述定理的结论 2 知:
\begin{align}
\frac{\bar{x}-\mu}{\sigma / \sqrt{n}} = N(0,1)
\end{align}
然后将 \ref{e1} 左端改写为
\begin{align}
\frac{\sqrt{n}(\bar{x}-\mu)}{s} = \dfrac{\dfrac{\bar{x}-\mu}{\sigma / \sqrt{n}}}{\sqrt{\dfrac{(n-1)\cdot s^2 / \sigma^2}{n-1}}}
\end{align}
由于分子是标准正态变量,分母的根号里是自由度为 \(n-1\) 的 \(t\) 变量除以它的自由度,且分子与分母相互独立,由 \(t\) 分布定义可知 \(t \sim t(n-1)\),证毕。
?
??推论 2: 设 \(x_1,x_2,\cdots, x_m\) 是来自 \(N(\mu_1,\sigma_1)\) 的样本,\(y_1,y_2,\cdots, y_n\) 是来自 \(N(\mu_2,\sigma_2)\) 的样本,且此两样本相互独立,记
\begin{align}
s_x^2 = \dfrac{1}{m-1}\sum_{i=1}^m(x_i-\bar{x})^2,\quad s_y^2 = \dfrac{1}{m-1}\sum_{i=1}^n(y_i-\bar{y})^2
\end{align}
其中
\begin{align}
\bar{x}= \frac{1}{m} \sum_{i=1}^m x_i, \quad \bar{y} = \frac{1}{n}\sum_{i=1}^n y_i
\end{align}
则有
\begin{align}
F = \frac{s_x^2 / \sigma_1^2}{s_y^2 / \sigma_2^2} \sim F(m-1, n-1)
\end{align}
特别地,若 \(\sigma_1^2 = \sigma_2^2\),则 \(F = s_x^2 / s_y^2 \sim F(m-1,n-1)\).
?
??证明:由两样本独立可知,\(s_x^2\) 与 \(s_y^2\) 相互独立,且
\begin{align}
\dfrac{(m-1)s_x^2}{\sigma_1^2} \sim \mathcal{X}^2(m-1),\quad \dfrac{(n-1)s_y^2}{\sigma_2^2} \sim \mathcal{X}^2(n-1)
\end{align}
由 \(F\) 分布定义可知 \(F \sim F(m-1,n-1)\).
?
??推论 3: 在上述记号下,设 \(\sigma_1^2 = \sigma_2^2=\sigma^2\),并记
\begin{align}
s_w^2 = \dfrac{(m-1)s_x^2+(n-1)s_y^2}{m+n-2} = \dfrac{\sum_{i=1}^m(x_i-\bar{x})^2 + \sum_{i=1}^n(y_i-\bar{y})^2}{m+n-2}
\end{align}

\begin{align}
\dfrac{(\bar{x}-\bar{y} - (\mu_1-\mu_2))}{s_w \sqrt{\dfrac{1}{m}+ \dfrac{1}{n}}} \sim t(m+n-2)
\end{align}
??证明:由 \(\bar{x}\sim N(\mu_1, \sigma^2 / m)\),\(\bar{y}\sim N(\mu_2, \sigma^2 / n)\),\(\bar{x}\) 与 \(\bar{y}\) 独立,故有
\begin{align}
\bar{x}-\bar{y} \sim N \left( \mu_1-\mu_2, \left( \dfrac{1}{m}+\dfrac{1}{n} \right) \sigma^2 \right)
\end{align}
所以
\begin{align}
\dfrac{(\bar{x}-\bar{y} - (\mu_1-\mu_2))}{\sigma \sqrt{\dfrac{1}{m}+ \dfrac{1}{n}}} \sim N(0,1)
\end{align}
由上述定理知,\(\dfrac{(m-1)s_x^2}{\sigma^2}\sim \mathcal{X}^2(m-1)\),\(\dfrac{(n-1)s_y^2}{\sigma^2}\sim \mathcal{X}^2(n-1)\),且它们相互独立,则由可加性知
\begin{align}
\dfrac{(m+n-2)s_w^2}{\sigma^2} = \dfrac{(m-1)s_x^2+(n-1)s_y^2}{\sigma^2} \sim \mathcal{X}^2(m+n-2)
\end{align}
由于 \(\bar{x}-\bar{y}\) 与 \(s_w^2\) 相互独立,根据 \(t\) 分布的定义即可得到结论。
?
?
?

原文地址:https://www.cnblogs.com/zhoukui/p/8992085.html

时间: 2024-10-09 08:25:21

关于正态总体的样本均值与样本方差的重要结论的相关文章

样本均值的标准误差|样本均值的标准差|总体标准差|样本标准差|简单随机抽样|样本均值估计|样本方差估计|

应用统计学 统计量与抽样分布 精确估计:当总体满足正态分布时.一个样本参数估计,估计总体均值时. 总体方差已知时,用样本均值满足抽样分布来估计,(其中,抽样分布是正态分布,抽样分布均值是总体均值,抽样分布方差是总体方差与样本数的比值)来估计,即如下式: 此方法的进阶版就是将样本均值写成Z分布形式,z分布满足正态分布: 总体方差未知时,用样本均值满足抽样分布来估计,(其中,抽样分布是t分布,抽样分布与将总体均值的关系)来估计(区间估计),即如下式: 一个样本参数估计,估计总体方差时(区间估计).

概率论与数理统计-ch6-样本与抽样分布

概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质.数字特征等. 在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独立的试验得到许多观察值去推断随机变量的种种可能分布. 1.随机样本 总体:试验的全部可能的观察值.   =样本空间 个体:每一个可能观察值. =样本点 容量:总体中所包含的个体的个数. 有限总体 无限总体 一个总体对应一个随机变量X,对总体的研究就是对随机变量X的研究.所以将不区分总体与相应的随机变量,统称为总体X. 样本:在数理统计中,人们都

概率统计基本概念总结

一.概率论基本概念样本空间.随机事件频率和概率概率的相关运算和性质等可能概型:古典概型条件概率全概率公式:你用条件概念算事件概率贝叶斯公式:条件概率用于反推计算条件概率事件的相互独立性二.随机变量极其分布随机变量:每个样本点映射一个数字来表征基本离散型随便基变量分布:0-1分布.伯努利实验二项分布.泊松分布分布函数:随机变量概率在小于某随机变量的区间的概率和概率密度函数:连续性的随即变量的概率密度分布函数,分布函数是密度函数的定积分.概率密度的几种分布:均匀分布.指数分布.正态分布.随机变量之间

CS考研_统考大纲

序号 政治 外语 业务课一 业务课二 1 (101)思想政治理论 (201)英语一 (301)数学一 (408)计算机学科专业基础综合 以上是计算机全国统考考试科目,三门公共课非统考基本也都是这三个,大家如果看到非统考的科目如果是三个1,就可以直接来参考我这里列出的大纲了!所以在此,我就直接列出最近的2015年考研这四个的考试大纲: 政治101: Ⅰ.考试性质 思想政治理论考试是为高等院校和科研院所招收硕士研究生而设置的具有选拔性质的全国招生考试科目,其目的是科学.公平.有效地测试考生掌握大学本

复旦考研信息整理

复旦大学考研网:http://www.kaofudan.com/kaoyanjingyan/ 复旦大学考研资料:http://yz.kaoyan.com/fudan/ziliao/ 复旦大学考研真题:http://download.kaoyan.com/list-12-t-1 复旦大学考研网:http://www.kaofudan.com/kaoyanziliao/ 计算机科学与技术专业:http://www.kaofudan.com/kaoyanziliao/jisuanjikexuejish

数学随想之一抽样分布与总体分布

本文主要想说明三个问题: 一是样本的数字特征,二是样本方差和样本均值的方差的区别,三是三大分布怎样构造抽样分布. (一) 为了简便,假设有一个正态分布总体ξ~N(µ,σ2),设想我们从中随机抽取n个样本,ξ1,...ξn. 此时就有样本均值和样本方差了. 样本均值很好理解,不就是算术平均: 而样本方差呢,按之前理解方差不就是: 而实际上样本方差为: 差别在哪,分母对吧,实际上是n-1.当然肯定有童鞋记得统计学里说过样本方差的自由度就是n-1 好就算是n-1,那又是为什么呢? 这就要回归到问题的本

数学1 考纲

考试科目:高等数学.线性代数.概率论与数理统计 考试形式和试卷结构 一.试卷满分及考试时间 试卷满分为150分,考试时间为180分钟 二.答题方式 答题方式为闭卷.笔试 三.试卷内容结构 高等教学约56% 线性代数约22% 概率论与数理统计约22% 四.试卷题型结构 单选题8小题,每小题4分,共32分 填空题6小题,每小题4分,共24分 解答题(包括证明题)9小题,共94分 高等数学 一.函数.极限.连续 考试内容 函数的概念及表示法函数的有界性.单调性.周期性和奇偶性复合函数.反函数.分段函数

常用统计量的分布

所谓统计量,就是指没有未知参数的样本的函数. 常见的统计量有: 样本均值: 样本方差: 一般认为 S > 0,称作是样本的标准差. 应当区别样本均值与变量的均值,样本的方差与变量的方差. 样本具有一天然的性质,他们与总体都是同分布的.我们统一设总体的均值是,方差是 . 值得一说的是,样本方差求和部分的 n 个值并不是完全相互独立的.应该认识到有一明显的约束: 从自由度的角度考虑,那 n 个变量的自由度只有 n - 1,那么样本方差的分母是 n - 1 而不是 n 这一点就不是难以理解的了. 类似

【数理统计学习】统计假设检验

统计假设检验可分为参数假设检验和非参数假设检验两大部分. 当总体分布形式已知,检验的目的是对总体的参数及其性质作出判断,则称这种检验为参数假设检验. 若总体分布形式未知,需对总体分布函数形式或总体之间的关系进行推断,则称为非参数假设检验. 显著性检验:先提出假设,然后作出否定或者不否定的判断,称为显著性检验. 一.检验法则 有两个对立的假设,其中\(H_0\)称为原假设(零假设);\(H_1\)称为备择假设(对立假设). 要检验总体均值\(\mu\),实际上可转化为检验样本均值\(\overli