自由度的理解

数学中的自由度一般是指能够自由取值的变量个数。数理统计中的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数。

当有约束条件时,自由度减少,自由度计算公式:自由度=样本个数-样本数据受约束条件的个数,即自由度=n-k(n样本个数,k约束条件个数)。例如,一组数据,平均数一定,则这组数据有n-1个数据可以自由变化;如一组数据平均数一定,标准差也一定,则只有n-2个数据可以自由变化。

假设一个容量为10的样本,如果没有其他关于该样本的信息或约束的话,任意从总体中抽取的10个观察值都可以形成这样的样本。也就是说,这10个观察值可以任意地被从总体中抽取的其他观察值所取代。当我们想要计算样本方差时,必须先算出样本均值,设=35。此时,这10个观察值就不能任意地被总体中抽取的其他观察值所取代了。因为n=350,10个观察值的总和必须等于350。这样一来,样本中只有9个观察值可以随意改变,因为如果任意9个观察值确定了,第10个观察值也被这9个值确定了。因此在计算样本方差时自由度等于9。有效样本容量被减少为n-1,在此基础上,我们可以很好地理解为什么作为均方差的样本方差计算时,要用自由度来平均而非用n平均

?

时间: 2024-08-13 20:40:51

自由度的理解的相关文章

【番外篇】关于多元线性回归以及主成成分分析的一点思考

前两天在研究期权组合问题,突然觉得对统计有了一点新的理解,所以今天写一点关于多元线性方面的东西,以待后用. 1. 多元线性回归的基本形式: 一个因变量,比如说某个地区的气温,被认为是由其他几个自变量,比如海拔.阳光亮度.湿度等等有关.我这里把这几个自变量理解为对应的instrument.假设有n次观测,那么得到的数据就是: 这里可以理解为在每次观测中,我们有Y这个Portfolio以及各个instrument对应的值.现在,我们就要找出这个Portfolio到底由对应的多少个instrument

深入理解图优化与g2o:图优化篇

前言 本节我们将深入介绍视觉slam中的主流优化方法——图优化(graph-based optimization).下一节中,介绍一下非常流行的图优化库:g2o. 关于g2o,我13年写过一个文档,然而随着自己理解的加深,越发感觉不满意.本着对读者更负责任的精神,本文给大家重新讲一遍图优化和g2o.除了这篇文档,读者还可以找到一篇关于图优化的博客: http://blog.csdn.net/heyijia0327 那篇文章有作者介绍的一个简单案例,而本文则更注重对图优化和g2o的理解与评注. 本

实现HTTPS系列第四弹之【TLS ,SSL等概念理解】

博文说明[前言]: 本文将通过个人口吻介绍TLS ,SSL,PKI等相关知识,在目前时间点[2017年5月21号]下,所掌握的技术水平有限,可能会存在不少知识理解不够深入或全面,望大家指出问题共同交流,在后续工作及学习中如发现本文内容与实际情况有所偏差,将会完善该博文内容. 1.第一弹:实现HTTPS系列第一弹之[http,https,www,web等概念简介] 博文链接:http://watchmen.blog.51cto.com/6091957/1922919 2.第二弹:实现HTTPS系列

我对REST的理解

1:rest的由来 REST即表述性状态传递(英文:Representational State Transfer,简称REST) 通俗点说:资源在网络中以某种表现形式进行状态转移. 源于REST之父 Roy Thomas Fielding 2000年的一篇博士论文. Fielding是一个非常重要的人,他是HTTP协议(1.0版和1.1版)的主要设计者.Apache服务器软件的作者之一.Apache基金会的第一任主席. 所以,他的这篇论文一经发表,就引起了关注,并且立即对互联网开发产生了深远的

从内存使用的角度来理解.Net底层架构

.NET的很多概念如果总是从语法的角度或许你永远都不会理解到底为什么他会这么架构,但是如果你换个角度或许这些都会迎刃而解.从底层理解.NET的架构你就离高手更近一步了.本文只是从个人角度来瞅一眼为什么.NET的架构,若有不对的地方,还请各位指正.OK, here we go. C/C++等程序如何使用内存 技术毕竟是一个逐渐积累进步的过程,.NET的推出不乏抄袭其他语言的地方,但是他有自己独特的地方,至于为什么会独特肯定会有语言的过人之处.  1.预备知识 C/C++编译的程序占用的内存分为以下

理解MySql事务隔离机制、锁以及各种锁协议

一直以来对数据库的事务隔离机制的理解总是停留在表面,其内容也是看一遍忘一边.这两天决定从原理上理解它,整理成自己的知识.查阅资料的过程中发现好多零碎的概念如果串起来足够写一本书,所以在这里给自己梳理一个脉络,具体的内容参考引文或在网上搜一下.由于平时接触最多的是MySQL,所以文章中某些部分是MySQL特有的特性,请读者注意. 数据库并发操作会引发的问题: 多个事务同时访问数据库时候,会发生下列5类问题,包括3类数据读问题(脏读,不可重复读,幻读),2类数据更新问题(第一类丢失更新,第二类丢失更

统计学常用概念:T检验、F检验、卡方检验、P值、自由度

1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定. 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果.倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很 少.很罕有的情况下才出现:那我们便可以有信心的说,这不是巧合,是具有统计学上的意义的(用统计学的话讲,就是能够

统计学中的自由度

数理统计研究问题的方式,不是对所研究对象的全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断.数理统计方法具有“部分推断整体”的特征. 数学中的自由度一般是指能够自由取值的变量个数.数理统计中的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的数据的个数,自由度通常记为df.数理统计上的这个定义可以从如下几个方面来理解: 第一,“统计量”(如样本数据的平均数X.样本数据的标准差)是研究者通过调查样本的数据人为地计算出

通俗理解T检验与F检验的区别【转】

转自:http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错的概率,我们会利用统计学家所开发的一些统计方法,进行统计检定. 通过把所得到的统计检定值,与统计学家建立了一些随机变量的概率分布(probability distribution)进行比较,我们可以知道在多少%的机会下会得到目前的结果.倘若经比较后发现,出现这结果的机率很少,亦即是说,是在机会很少.