数学随想之一抽样分布与总体分布

本文主要想说明三个问题：

一是样本的数字特征，二是样本方差和样本均值的方差的区别，三是三大分布怎样构造抽样分布。

（一）

为了简便，假设有一个正态分布总体ξ~N（µ，σ²），设想我们从中随机抽取n个样本，ξ_1，。。。ξ_n。

此时就有样本均值和样本方差了。

样本均值很好理解，不就是算术平均：

而样本方差呢，按之前理解方差不就是：

而实际上样本方差为：

差别在哪，分母对吧，实际上是n-1。当然肯定有童鞋记得统计学里说过样本方差的自由度就是n-1

好就算是n-1，那又是为什么呢？

这就要回归到问题的本质，我们抽样是为了什么？当然是为了用样本的性质估计总体的性质。

因此基于无偏估计的考虑，我们就用满足无偏性的S²作为样本方差，即S²满足E（S²）=σ²。数学证明见下面链接

PS：样本方差自由度为n-1的数学证明请复制链接 http://www.zhihu.com/question/20099757

（二）

好，我们知道了样本方差S²

这时候我要问了样本均值的方差又是什么呢？

回想下我们研究样本的初衷：即是用样本统计量T（ξ_1，。。。ξ_n）去推断总体ξ的分布和数字特征。其中样本统计量实质上是随机变量的函数。

而样本方差和样本均值的方差差别就在于：

样本方差：它是与ξ_1，。。。ξ_n的离差平方和除以n-1形成的样本统计量，虽然它和一般意义的方差一样具有离差平方和的形态。

但是，请注意，它其实是按照离差平方和形态构造的样本统计量，它是一个随机变量，构造它的目的是估计总体方差；

样本均值的方差：样本均值也是个样本统计量，它是总体均值的无偏估计。而样本均值的方差其实就是样本均值这个随机变量的方差。

假设有总体ξ~N（µ，σ²），ξ_1，。。。ξ_n为来自总体的容量为 n 的样本，由于是简单随机抽样，样本相互独立且每一个都与总体同分布。

则对于正态总体ξ，其样本均值的分布可以求出，由于独立正态分布具有可加性，样本均值服从~N(µ，σ²/n)。

从分布可知样本均值的方差为σ²/n。

（三）

说起构造抽样分布，肯定要先说说统计学的三大分布：

(1)卡方分布

定义：

性质：

(2)T分布

定义：

性质：

(3)F分布

定义：

性质：

三大分布都和标准正态分布有密切关系呢，大家看

好了废话不多说，构造抽样分布吧

沿用上文假设：有一个正态分布总体ξ~N（µ，σ²），设想我们从中随机抽取n个样本，ξ_1，。。。ξ_n。

则样本均值服从~N(µ，σ²/n)，标准化后~N(0，1)。

（1）我们知道卡方分布是标准正态分布的平方和的形式，此时联想到样本方差存在平方和形式的随机变量函数

我们尝试把µ，σ²配进去，配成标准正态分布的形式。

最后得到即（n-1）S²/σ²~。这个就是样本方差的分布。

（2）我们会碰到已知总体ξ的均值µ，而不知道总体方差σ²的时候。

此时，我们自然无法这样求出~N(µ，σ²/n)。于是我们构造，对比下，就是用S代替了σ来求样本均值分布而已。

看造型，想到了吧，T分布。

=/~t(n-1)。

（3）还有个F分布，F分布构造的是已知方差σ²的两总体的样本方差比的分布

其中n₁和n₂分别是来自两总体的样本的样本容量。

当然，还可以用三大分布构造其他抽样分布，这要根据你具体的业务问题定。

数学随想之一抽样分布与总体分布

时间： 2024-11-07 21:47:27

数学随想之一抽样分布与总体分布的相关文章

数学基础课--《看数学之美后的随想》（一）什么是数学？

什么是数学? 时隔近一年时间,终于把吴军老师的<数学之美>看完了,其间非常感谢李晓燕同学的帮助,帮我扫了很多盲.这一系列大体会按照<数学之美>的目录来进行构建,然后会附上我的一些理解,其实更多的应该算是摘记吧. 我也尽量会把我会的演算过程附上. 希望大家可以一起交流. 什么是数学? 我们为什么学数学呢? 虽然我们从小都在学数学,但是我们很少知道数学是什么? 那么什么是数学呢? 在如今,人们对数学总有一些议论.记得在中学时代,班里同学,甚至老师,偶尔也会说到,生活中用到的数学,其实在

数学基础课--《看数学之美后的随想》（二）信息的产生。

那么,我们就从最远古的时代说起,在古代的时候,人们只需要通过较少的语言进行沟通就好.就如在<乡土中国>所说,在一个小的村落中,我们的习俗已经被定义好了,以及人们与人的交流方式也已经进行了定义. 语言的产生比如,在古代的村落中,一位原始人A像另一位原始人B,说看那边有个美女.可能就是“呀呀”两句,而另一个原始人回复“呀呀呀”的意思可能就是我们去追她吧. 而这里面信息的传输和传播与我们今天的信息论有着一样的模型. 如下图所展示的. 随着村落的扩大,人们需要交流更多的事情了.以及要把一些好的

参数|统计量|抽样分布|估计标准误差|标准误差|标准误|标准差|二项分布|泊松分布|中心极限定理|样本方差|

4 二项分布近似正态分布的条件? 参数和统计量的区别? 总体参数通常用希腊字母表示,样本统计量通常用小写英文字母来表示抽样分布是一种理论分布吗? 抽样分布不是样本结果的分布,而是一种无法穷尽情况的分布,但是我们可以使用数学方法来求得进行这样抽取方法后的特统计量的分布.我们收取的样本点的统计量被认为包含在这样的函数曲线中.对于抽样分布来说,它的随机变量是样本统计量.我们能够借此还原样本统计量的分布,不是还原总体分布. 估计标准误差.标准误差.标准误.标准差是什么? 1.估计标准误差就简称为估计标

机器学习之数学原理笔记（三）

正定矩阵 1.1 定义广义:设M是n阶方阵,如果对任何非零向量z,都有zTMz> 0,其中zT 表示z的转置,就称M正定矩阵.[1] 狭义定义:一个n阶的实对称矩阵M是正定的的条件是当且仅当对于所有的非零实系数向量z,都有zTMz> 0.其中zT表示z的转置. 1.2 定理与性质 l 正定矩阵在合同变换下可化为标准型, 即对角矩阵. l 所有特征值大于零的对称矩阵(或厄米矩阵)也是正定矩阵. l 判定定理1:对称阵A为正定的充分必要条件是:A的特征值全为正. l 判定定理2:

【分享】近4000份数学学习资源免费分享给大家

一直以来喜欢收集数学类的教程资源,于是费了好大劲从万千合集站上扒拉了下来,总结归类了一下,一共有将近4000本电子书.经测试,均可免费下载,可能会弹出小广告,可不必理会之.[仅供学术学习和交流,请无用于商业用途.]另外,如有可能,还请尽量支持正版纸质书. 数学史(54) 数学史.rar 55.6 MB 数学的起源与发展.rar 4.3 MB 费马大定理—一个困惑了世间智者358年的谜.pdf 9.5 MB 通俗数学名著译丛14-无穷之旅:关于无穷大的文化史.pdf 14.

数学1 考纲

考试科目:高等数学.线性代数.概率论与数理统计考试形式和试卷结构一.试卷满分及考试时间试卷满分为150分,考试时间为180分钟二.答题方式答题方式为闭卷.笔试三.试卷内容结构高等教学约56% 线性代数约22% 概率论与数理统计约22% 四.试卷题型结构单选题8小题,每小题4分,共32分填空题6小题,每小题4分,共24分解答题(包括证明题)9小题,共94分高等数学一.函数.极限.连续考试内容函数的概念及表示法函数的有界性.单调性.周期性和奇偶性复合函数.反函数.分段函数

概率论与数理统计-ch6-样本与抽样分布

概率论中,所研究的随机变量是假定其分布是已知的,在此前提下研究它的性质.数字特征等. 在数理统计中,所研究的随机变量的分布是未知或不完全知道的,通过重复独立的试验得到许多观察值去推断随机变量的种种可能分布. 1.随机样本总体:试验的全部可能的观察值. =样本空间个体:每一个可能观察值. =样本点容量:总体中所包含的个体的个数. 有限总体无限总体一个总体对应一个随机变量X,对总体的研究就是对随机变量X的研究.所以将不区分总体与相应的随机变量,统称为总体X. 样本:在数理统计中,人们都

【生活随想】重整分类目录说明

现在的分类虽然简洁明了,但是查找却很难.CSDN的搜索功能非常···贫瘠,所以我决定优化分类目录,方便查找. 虽然不能像自己建站那样做的井然有序条理工整(我喜欢整洁和树状结构),但这样也要比之前简约不简便要好一些. 顺带在这里插个段子: 某月某日诸城一中,鄙人与WYW神犇聊天(我记得是WYW神犇,印象中怎么想都是小么哥,如有误伤十分抱歉) 此时,鄙人看到WYW神犇桌面上密密麻麻全是文件!铺满了整个屏幕!存盘强迫症患者表示简直无法忍受!= =你们难道不知道考虑一下密集恐惧症患者的感受吗?! 我:W

如何挖掘网络资源（编程随想的博客）

一:网站的类型和使用场景首先来介绍一下网站的类型和特点.不同的网站特点将决定你挖掘资源的方式. ★网站内容的指标要挖掘互联网的资源,首先需要关注网站的内容.俺大致总结了几个指标,任何网站的内容,都具有这几个指标. 通过这些指标,可以评估某个网站[对你的价值]到底有多大,还可以评估你挖掘其中的内容需要耗费多少时间和精力. ◇内容的信噪比任何一个网站的内容,都会有一些信息是无用的,咱们称之为"噪声".所谓的[信噪比],就是是"有用信息"与"垃圾噪声&qu