【数理统计学习】统计假设检验

统计假设检验可分为参数假设检验非参数假设检验两大部分。

总体分布形式已知,检验的目的是对总体的参数及其性质作出判断,则称这种检验为参数假设检验

总体分布形式未知,需对总体分布函数形式或总体之间的关系进行推断,则称为非参数假设检验

显著性检验:先提出假设,然后作出否定或者不否定的判断,称为显著性检验。

一、检验法则

有两个对立的假设,其中\(H_0\)称为原假设(零假设);\(H_1\)称为备择假设(对立假设)

要检验总体均值\(\mu\),实际上可转化为检验样本均值\(\overline{X}\),因为\(\overline{X}\)的观察值\(\overline{x}\)的大小在一定程度上反映了的\(\mu\)大小。如果\(H_0\)成立,则\(\mid \overline{x}-\mu_0 \mid\)一般不应太大,如果\(\mid \overline{x}-\mu_0 \mid\)过分大,则可怀疑\(H_0\)的正确性从而拒绝\(H_0\),反之则接受\(H_0\)。

又考虑到当\(H_0\)成立时,统计量 $\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} $ ~ $ N(0,1)$,这样衡量 \(\mid \overline{x} - \mu_0 \mid\) 的大小就可等价地归结为衡量 $\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} $ 的大小,由此我们可选定一正数\(k\),使得当\(\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} \geq k\)时,就拒绝\(H_0\),当\(\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} < k\)时,就接受\(H_0\)。

由于\(\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} ?\) ~ $ N(0,1)?$,根据标准正态分布分位点定义可得:

\[P \lbrace \frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} \geq k \mid H_0为真 \rbrace = P \lbrace \frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} \geq u_{1-\frac{\alpha}{2}} \mid H_0为真 \rbrace = \alpha?\]

这样,我们就得到如下检验法则:

若\(\frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} \geq u_{1-\frac{\alpha}{2}}\),则拒绝\(H_0\);

若\(\frac{\mid \overline{x} - \mu_0 \mid}{\sigma / \sqrt{n}} < u_{1-\frac{\alpha}{2}}\),则接受\(H_0\)。

于是,$\frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}} $就成了检验统计量。

当然,这只是讨论了正态总体参数的假设检验问题,对于其他假设检验,虽然检验统计量不同,但其检验法则、基本思路一样。

二、两类错误

(一)第I类错误

当\(H_0\)为真时,我们却作出了拒绝\(H_0\)的判断,这个时候我们就犯了第I类错误,又称为“弃真”。即在原假设成立的情况下拒绝了原假设,从而把正确的内容当作错误的内容抛弃了。

犯第I类错误的概率为:\(P \lbrace 拒绝H_0 \mid H_0为真 \rbrace = \alpha\)

这里,\(\alpha\)为显著性水平。

(二)第II类错误

当\(H_0\)不成立时,却接受\(H_0\)了,我们称这类错误为第II类错误,又称为“取伪”

犯第II类错误的概率为:\(P \lbrace 接受H_0 \mid H_0为假 \rbrace = \beta\)

现实中\(\alpha\)、\(beta\)的值不可能同时小,也就是说,在样本容量给定的情况下,如果减少犯第I类错误的概率,就可能增加犯第II类错误的概率。由于第I类错误相对于第II类错误导致的后果更为严重,因此现实中的做法通常是对犯第I类错误的概率加以控制,然后再适当考虑犯第II类错误的概率。

我们把这种只对犯第I类错误的概率加以控制,而不考虑犯第II类错误的检验问题,称为显著性检验问题

三、基本方法

参数假设检验通常采用\(\mu\)检验法、\(t\)检验法、\(F\)检验法、\(\chi^2\)检验法等

非参数假设检验通常采用皮尔逊拟合检验、魏氏检验、麦氏检验法

(一)参数假设检验法

参数假设检验法具体包括正态总体参数检验和非正态总体参数检验。

1、正态总体参数检验

对于正态总体,其参数无非是两个:\(\mu\)和\(\sigma^2\)。如果加上两个正态总体的参数一块比较,也只有四种情形:①关于\(\mu\)的检验;②关于\(\sigma^2\)的检验;③关于\(\mu_1-\mu_2\)的检验;④关于\(\frac{\sigma_1^2}{\sigma_2^2}\)的检验。

(1)\(\mu\)检验

\(\mu\)检验适用于在方差已知的情况下,对期望值\(\mu\)的检验(包括单总体和多总体)。

a.在单个正态总体情况下,适用检验统计量:

\(\mu = \frac{\mid \overline{x}-\mu_0 \mid}{\sigma /\sqrt{n}}\)~\(N(0,1)\)

b.在两个正态总体情况下,设\(x_1,x_2,\ldots,x_{n_1}\),为出自\(N(\mu_1,\sigma_1^2)\)的样本,\(y_1,y_2,\ldots,y_{n_2}\)为出自\(N(\mu_2,\sigma_2^2)\)的样本,\(\sigma_1^2,\sigma_2^2\)已知,且样本之间相互独立。则适用统计量为:

\(\mu = \frac{\overline{x} - \overline{y}}{\sqrt{\frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2}}}\) ~ \(N(0,1)\)

另外,对总体百分数的检验一般也采用检验法进行,其适用统计量为:

\[\mu = \frac{p_x-p_{\mu}}{\sqrt{\frac{p_{\mu}(1-p_{\mu})}{n}}}\]

其中,\(p_x\)为样本百分数,\(p_{\mu}\)为总体百分数。

(2)\(t\)检验

\(t\)检验适用于当方差未知时对期望值\(\mu\)的检验。总体可以是单总体,也可以是双总体。但如果是双总体,它们之间的样本必须是独立的。

a.对于单总体,适用检验统计量为:

\(t= \frac{\overline{x} - \mu_0}{\frac{s}{\sqrt{n}}}\)~\(t(n-1)\)

b.对于双总体,可分为两种情况进行讨论。

第一种情况是,\(\sigma_1^2,\sigma_2^2\)未知,但\(\sigma_1^2=\sigma_2^2=\sigma^2\)。此时可选择检验统计量:

\(t= \frac{\overline{x} -\overline{y}}{s_{\omega} \cdot \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\)~\(t(n_1+n_2-2)\)

第二种情况是,\(\sigma_1^2,\sigma_2^2\)未知,但\(n_1=n_2=n\)。此时可考虑采用配对检验法,具体方法如下:

令:\(d_i=x_i-y_i(i=1,2,\ldots,n)\),并假定\(d_1,d_2,\ldots,d_n\)分别是来自正态总体\(N(\mu_d,\sigma^2)\)的样本。\(\mu_d,\sigma^2\)均未知,\(\overline{d}\)与\(s^2\)分别是\(d_1,d_2,\ldots,d_n\)的样本均值和样本方差。若进行双边检验,可令\(H_0:\mu_d=0,H_1:\mu_d \neq 0\)。

此时可选择\(t= \frac{\overline{d}-0}{\frac{s}{\sqrt{n}}}\)~\(t_{1-\frac{\alpha}{2}}(n-1)\)作为检验统计量,其拒绝域为:

\[c_1= \lbrace t \mid \mid t \mid \geq t_{1-\alpha}(n-1) \rbrace\]

(3)\(\chi^2\)检验

\(\chi^2\)检验主要用于对方差\(\sigma^2\)的检验,且适用于单参数情形

a.\(\mu\)未知

设\(x_1,x_2,\ldots,x_n\)为\(N(\mu,\sigma^2)\)的一个样本,考虑假设:

①\(H_0:\sigma^2 = \sigma_0^2, H_1:\sigma^2 \neq \sigma_0^2\)

②\(H_0:\sigma^2 \leq \sigma_0^2, H_1:\sigma^2 > sigma_0^2\)

适用检验统计量为:

\(\chi^2 = \frac{(n-1)s^2}{\sigma_0^2}\)~\(\chi^2(n-1)\)

b.\(\mu\)已知

适用于检验统计量为:

\(\chi^2 = \frac{\sum_{i=1}^n (x_i-\mu_0)^2}{\sigma_0^2}\)~\(\chi^2(n)\)

(4)\(F\)检验

\(F\)检验也是用于对方差的检验,不同的是,\(F\)检验往往用于两参数情形

设\(x_1,x_2,\ldots,x_{n_1}\)和\(y_1,y_2,\ldots,y_{n_2}\)分别为出自\(N(\mu_1,\sigma_1^2)\)和\(N(\mu_2,\sigma_2^2)\)的样本,且样本之间独立。考虑假设:

①\(H_0:\sigma_1^2=\sigma_2^2, H_1:\sigma_1^2 \neq \sigma_2^2\)

②\(H_0:\sigma_1^2 \leq \sigma_2^2, H_1: \sigma_1^2 > \sigma_2^2\)

适用检验统计量为:

\(F=\frac{s_1^2}{s_2^2}\)~\(F(n_1-1,n_2-1)\)

2、非正态总体参数检验

非正态总体的抽样分布不易求出,求检验统计量及其分布就很困难了,因此除一些特殊例子外,非正态总体参数的假设检验常采用大样本方法。大样本一般要求\(n \geq 30\),最好\(n \geq 50\)。

设\(x_1,x_2,\ldots,x_n\)是总体\(X\)的样本,\(X\)~\(N(\mu,\sigma^2 )\),\(n\)足够大。要检验的假设有:

(1)\(H_0:\mu=\mu_0, H_1:\mu \neq \mu_0\)

(2)\(H_0:\mu \geq \mu_0, H_1:\mu < \mu_0\)

(3)\(H_0:\mu \leq \mu_0, H_1:\mu > \mu_0\)

由于\(X\)不是正态分布,故求出其检验统计量及其分布比较困难,但当\(n\)足够大且\(H_0\)成立时,根据中心极限定理,有:

\(\mu = \frac{\overline{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}}\)~\(N(0,1)\)

在具体选择检验统计量时,可分两种情况讨论:

(1)当\(\sigma^2\)已知时,可选择检验统计量:

\(\mu = \frac{\overline{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}}\)~\(N(0,1)\)

(2)当\(\sigma^2\)未知时,可选择检验统计量:

\(\mu = \frac{\overline{x} - \mu_0}{\frac{s}{\sqrt{n}}}\)~\(N(0,1)\)

(二)非参数检验法

1、皮尔逊\(\chi^2\)拟合检验法

2、魏氏(Wilcoxon)检验

3、麦氏(McNehmar)检验

参考文献:

[1] 《统计学》第二版. 2010. 游士兵

原文地址:https://www.cnblogs.com/IvyWong/p/10024136.html

时间: 2024-10-28 02:26:25

【数理统计学习】统计假设检验的相关文章

每月学习数理统计--《统计学习方法—李航》(1)

现在这本书已经看完70%,在看完后我将会将每一章的内容按照自己的理解并结合其他书籍包括<<统计机器学习导论>>[1] ,<<机器学习>>[2],<<大数据分析>>[3]这三本书总结经典的几大算法原理与代码实现.下面是预计的写作思路: 一.分类学习 1.SVM 2.决策树 3.Logistic 回归 4.贝叶斯判别法 5.K近邻法 6.最小二乘法 7.最大熵模型 8.高斯混合模型 二.集成学习 1.Random Forest 2.GBD

每月学习数理统计--《统计学习方法—李航》(2): 感知器

1. 感知器的介绍 2.感知器的算法 3.感知器的更新规则 4.感知器的收敛性 5.感知器的局限性 1. 感知器的介绍 首先 2. 感知器的算法 3. 感知器的更新规则 4. 感知器的收敛性 5. 感知器的局限性 原文地址:https://www.cnblogs.com/tjpeng/p/10326100.html

概率论与数理统计学习笔记

第一章 随机事件与概率 第二章 随机变量及其分布 第三章 多维随机变量及其分布 第四章 大数定律与中心极限定理 第五章 统计量及其分布 第六章 参数估计 第七章 假设检验 第八章 方差分析与回归分析 第一章 随机事件与概率 1.1随机事件及其运算 概率论与数理统计研究的对象是随机现象. 概率论是研究随机现象的模型(即概率分布),数理统计是研究随机现象的数据收集与处理. 随机现象: 在一定的条件下,并不总是出现相同结果的现象称为随机现象 样本空间:随机现象的一切可能基本结果组成的集合称为样本空间

201671010145 赵乾 学习统计

周次 (阅读/编写)代码行数 发布博客量/博客评论数量 课堂/课余学习时间(小时) 最满意的编程任务 第1周  10/6  1/2 6/10    第2周  11/16 1   6/11   第3周         第4周         第5周         第6周         第7周         第8周         第9周         第10周         第11周         第12周         第13周         第14周         第15周

oracle学习----统计信息

1.收集统计信息的方式 for all columns size skewonly BEGIN  DBMS_STATS.GATHER_TABLE_STATS(ownname          => 'SCOTT',                                tabname          => 'TEST',                                estimate_percent => 100,                        

python学习--统计序列中元素出现的频度(次数)

例如有一个列表 l=[1,1,-1,2,3,22,34,32,2,-3,34,22,-5] 统计列表中每个元素出现的多少次 方式一: 先把列表变成一个字典dict,字典的key对应列表中的每一个元素,value代表每个元素出现的次数 d=dict.fromkeys(l,0)#两个参数,第一个参数为对应的列表,第二个参数设置dict的默认value=0. 然后,遍历列表中每一个元素,dict中碰到该元素,value就加1. for x in l: d[l]+=1 print(d) 方式二: 利用集

【分享】近4000份数学学习资源免费分享给大家

一直以来喜欢收集数学类的教程资源,于是费了好大劲从万千合集站上扒拉了下来,总结归类了一下,一共有将近4000本电子书.经测试,均可免费下载,可能会弹出小广告,可不必理会之.[仅供学术学习和交流,请无用于商业用途.]另外,如有可能,还请尽量支持正版纸质书.   数学史(54)     数学史.rar 55.6 MB   数学的起源与发展.rar 4.3 MB   费马大定理—一个困惑了世间智者358年的谜.pdf 9.5 MB   通俗数学名著译丛14-无穷之旅:关于无穷大的文化史.pdf 14.

作业一 统计软件简介与数据操作

spss软件 所属类别 : 软件 SPSS(Statistical Product and Service Solutions),"统计产品与服务解决方案"软件.最初软件全称为"社会科学"(SolutionsStatistical Package for the Social Sciences),但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为"统计产品与服务解决方案",标志着SPSS的战略方向正

机器学习周志华——学习器性能度量

衡量模型泛化能力的评价标准,就是性能度量(performance measure). (1)错误率与精度 (2)查准率.查全率与F1 基于样例真实类别,可将学习器预测类别的组合划分为真正例(true positive).假正例(false positive).真反例(true negative).假反例(false negative),TP.FP.TN.FN分别表示其对应的样例数,则有TP+FP+TN+FN=样例总数. 查准率P与查全率R分别定义为: P= TP/(TP+FP)=>正例结果中真正