T 分布(近似标准正态分布)

1.1      定义

定义:假设X服从标准正态分布N(0,1),Y服从 卡方分布,那么 的分布称为自由度为n的t分布,记为 。

分布密度函数 ,其中,Gam(x)为伽马函数。

可用于两组独立计量资料的假设检验。

由于在实际工作中,往往σ(总体方差)是未知的,常用s(样本方差)作为σ总体方差的估计值,为了与u变换(正态化变换)区别,称为t变换,统计量t 值的分布称为t分布。【u分布也叫标准正态分布】

u变换:[(X-μ)/σ]转化成标准正态变量u,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布(standard normaldistribution),亦称u分布。

概率论统计学中,t-分布t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。

经常应用在对呈正态分布的总体的均值进行估计。它是对两个样本均值差异进行显著性测试的学生t测定的基础。t检定改进了Z检定(en:Z-test),不论样本数量大或小皆可应用。在样本数量大(超过120等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用学生t检定。

t分布曲线形态与n(确切地说与自由度df)大小有关。与标准正态分布曲线相比,自由度df越小,t分布曲线愈平坦,曲线中间愈低,曲线双侧尾部翘得愈高;自由度df愈大,t分布曲线愈接近正态分布曲线,当自由度df=∞时,t分布曲线为标准正态分布曲线。

当总体的标准差是未知的但却又需要估计时,我们可以运用t-分布。

【特征】:

(1)以0为中心,左右对称的单峰分布;

(2)其数学期望E(Z) = 0,n>1;方差D(Z)=n/n-2 , n>2 。

(3)t分布是一簇曲线,其形态变化与n(确切地说与自由度df)大小有关。自由度df越小,t分布曲线越低平;自由度df越大,t分布曲线越接近标准正态分布(u分布)曲线;

(4)随着自由度逐渐增大,t分布逐渐接近标准正态分布。

【本质】:

T分布本质上和标准正态分布没有太大本质差别,可以说就是标准正态分布的一个近似分布。而标准正态分布只是正态分布的一个特殊情况。综上,从本质上说,T分布就是正态分布的一种特殊的近似。

t分布是正态分布的小样本形态。

①正态分布是与自由度无关的一条曲线; t分布是依自由度而变的一组曲线。

② t分布较正态分布顶部略低而尾部稍高。

原文地址:https://www.cnblogs.com/quietwalk/p/8276112.html

时间: 2024-10-25 00:18:59

T 分布(近似标准正态分布)的相关文章

标准正态分布随机变量的倒数的分布

背景 看到有人在问这个问题,拿来算算. 自从有了CSDN-MarkDown之后,写博客舒服多了,尤其是数学公式部分. 原理 推荐的参考书是: Schaum's outline of Probability and Statistics, 3rd Edition, 2009; 科学出版社2002年翻译出版了该书的第二版,所以有中文版. Continuous Variables Theorem: Let X be a continous random variable with probabilit

标准正态分布+标准正态分布概率表+分布函数+积分

X~N(μ,σ²):一般正态分布:均值为μ.方差为σ² http://blog.csdn.net/zhanghongxian123/article/details/39008493 对于标准正态分布来说,存在一张表,称为:标准正态分布表: 该表计算的是:P(X<=x)[某个数落在某个[[email protected],x]]的概率.也就是下面阴影图形所示的面积: 如果x=1.96.则将1.96拆分为1.9和0.06.横轴1.9和纵轴0.06的交汇处:0.975.就是x<=1.96的概率. 也

Python中怎样生成一个服从标准正态分布的矩阵??

例如要产生一个标准正态分布的矩阵,矩阵维数为2*3,则代码如下: 1 from numpy import *; 2 def rand_Matrix(): 3 randArr=random.randn(2,3); 4 randMat=mat(randArr); 5 return randMat; 一种结果如下: 1 matrix([[ 0.3150869 , -0.02041996, -0.15361071], 2 [-0.75507988, 0.80393683, -0.31790917]])

[C#] 查标准正态分布表

static double[] ayZTFB = null; /// <summary> /// 计算标准正态分布表 /// </summary> /// <param name="input"></param> /// <returns></returns> public static double CalcN(double input) { if (ayZTFB == null) { //从0.00到3.09的

C语言产生标准正态分布或高斯分布随机数

C语言 产生标准正态分布或高斯分布 随机数 产生正态分布或高斯分布的三种方法: 1. 运用中心极限定理(大数定理) 1 #include 2 #include 3 4 #define NSUM 25 5 6 double gaussrand() 7 { 8 double x = 0; 9 int i; 10 for(i = 0; i < NSUM; i++) 11 { 12 x += (double)rand() / RAND_MAX; 13 } 14 15 x -= NSUM / 2.0; 1

标准正态分布的累积密度函数

先是考虑把正态分布的那张表搞到程序中,通过查表的方式,小数点三位后面多出来的值使用公式来计算,代码如下 转自:http://my.oschina.net/jianfengz/blog/224256,感谢分享! private static double[][] normdist = { {0.5,0.504,0.508,0.512,0.516,0.5199,0.5239,0.5279,0.5319,0.5359}, {0.5398,0.5438,0.5478,0.5517,0.5557,0.55

决策树(二)

简介 剪枝(pruning)是指通过移除决策树的某一部分以减少树的大小,被移除的部分的分类能力比较弱,从而降低最终分类器的复杂度,提高泛化能力. 从上一篇文章中,我们知道决策树是通过递归算法产生,然而这可能会出现过拟合(overfitting),也就是,一味的拟合已知的训练数据集,可能会导致分类器过于复杂,对未知的数据分类并不准确.问题是最终的分类决策树的最优大小应该是什么.树越大则越复杂导致过拟合,而树越小的话则可能会忽略掉样本空间中比较重要的结构信息.其实,很难确定在构造决策树的时候,增加一

漫谈正态分布的生成

本文作者简介:王夜笙,就读于郑州大学信息工程学院,感兴趣的方向为逆向工程和机器学习,长期从事数据抓取工作(长期与反爬虫技术作斗争~),涉猎较广(技艺不精……),详情请见我的个人博客~ 个人博客地址:http://bindog.github.io/blog/ 邮箱:[email protected] 感谢怡轩同学的悉心指导~ 之前拜读了靳志辉(@rickjin)老师写的<正态分布的前世今生>,一直对正态分布怀着一颗敬畏之心,刚好最近偶然看到python标准库中如何生成服从正态分布随机数的源码,觉

t分布, 卡方x分布,F分布

T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-nd/4.0/)进行许可,转载署名需附带本号二维码,不可用于商业用途,不允许任何修改,任何谬误建议,请直接反馈给原作者,谢谢合作! 命名与源起 “t”,是伟大的Fisher为之取的名字.Fisher最早将这一分布命名为“Studen