方差、协方差、协方差矩阵的概念及意义

期望

离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和称为该离散型随机变量的数学期望(设级数绝对收敛),记为 E(x)。随机变量最基本的数学特征之一。它反映随机变量平均取值的大小。又称期望或均值。

若随机变量X的分布函数F(x)可表示成一个非负可积函数f(x)的积分,则称X为连续性随机变量,f(x)称为X的概率密度函数(分布密度函数)。

方差

方差是各个数据与平均数之差的平方的平均数。在概率论和数理统计中,方差(英文Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。在许多实际问题中,研究随机变量和均值之间的偏离程度有着很重要的意义。

方差刻画了随机变量的取值对于其数学期望的离散程度。

方差深入:

很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的,而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,12,20]和[8,9,11,12],两个集合的均值都是10,但显然两个集合差别是很大的,计算两者的标准差,前者是8.3,后者是1.8,显然后者较为集中,故其标准差小一些,标准差描述的就是这种“散布度”。之所以除以n-1而不是除以n,是因为这样能使我们以较小的样本集更好的逼近总体的标准差,即统计上所谓的“无偏估计”。而方差则仅仅是标准差的平方。

标准差

标准差(Standard Deviation) ,也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。

协方差

协方差分析是建立在方差分析和回归分析基础之上的一种统计分析方法。 方差分析是从质量因子的角度探讨因素不同水平对实验指标影响的差异。一般说来,质量因子是可以人为控制的。 回归分析是从数量因子的角度出发,通过建立回归方程来研究实验指标与一个(或几个)因子之间的数量关系。但大多数情况下,数量因子是不可以人为加以控制的。

在概率论和统计学中,协方差用于衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

上面几个统计量看似已经描述的差不多了,但我们应该注意到,标准差和方差一般是用来描述一维数据的,但现实生活我们常常遇到含有多维数据的数据集,最简单的大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解更多,比如,一个男孩子的猥琐程度跟他受女孩子欢迎程度是否存在一些联系啊,嘿嘿~协方差就是这样一种用来度量两个随机变量关系的统计量。

协方差的结果有什么意义呢?如果结果为正值,则说明两者是正相关的(从协方差可以引出“相关系数”的定义),也就是说一个人越猥琐就越受女孩子欢迎,嘿嘿,那必须的~结果为负值就说明负相关的,越猥琐女孩子越讨厌,可能吗?如果为0,也是就是统计上说的“相互独立”。

总结

必须要明确一点,协方差矩阵计算的是不同维度之间的协方差,而不是不同样本之间的。

理解协方差矩阵的关键就在于牢记它计算的是不同维度之间的协方差,而不是不同样本之间,拿到一个样本矩阵,我们最先要明确的就是一行是一个样本还是一个维度,心中明确这个整个计算过程就会顺流而下,这么一来就不会迷茫了~

时间: 2024-10-05 09:40:05

方差、协方差、协方差矩阵的概念及意义的相关文章

重载模块概念及意义

# -*- coding: utf-8 -*- #python 27 #xiaodeng #重载模块概念及意义 #正如我们所看见的那样,模块程序代码默认只对每一个过程执行一次,要强制使模块代码重新载入并重新运行,你需可以要求python #这么做,也就是调用reload内置函数. #导入模块只会在第一次被导入时,加载和执行该模块中的代码 #之后导入只会使用已加载的模块对象,而不会重新加载执行文件中的代码 #reload函数会强制已加载的模块的代码重新载入并重新运行.此文件中心的代码的赋值语句会在

方差 协方差

[方差 协方差]方差 variance协方差 covariancehttps://en.wikipedia.org/wiki/Variance方差 一个随机变量的方差描述的是它的离散程度,一个实随机变量的方差,也成为它的二阶矩或二阶中心动差.Informally, it measures how far a set of (random) numbers are spread out from their average value. Variance has a central role in

Review的概念与意义

是什么让Google的程序如此优秀 让Google的程序如此优秀的一个最重要的事情看起来是非常的简单:代码审查 在Google,没有程序,任何产品.任何项目的程序代码,可以在没有经过有效的代码审查前提交到代码库里. 从代码审查里能得到什么? •在代码提交前,用第二群眼睛检查一遍,防止bug混入.这是最常见的理解,也是它最不重要的一点. •代码审查的最大的功用是纯社会性的.如果你在编程,而且知道将会有同事检查你的代码,你编程态度就完全不一样了.你写出的代码将更加整洁,有更好的注释,更好的程序结构—

C++--继承的概念和意义、继承中的访问级别、不同的继承方式

一.继承的概念和意义 Q:类之间是否存在直接的关联关系?由这个问题由此联想到生活中的例子:组合A.组合关系:整体与部分的关系组合关系的描述--代码示例 #include <iostream> #include <string> using namespace std; class Memory { public: Memory() { cout << "Memory()" << endl; } ~Memory() { cout <&

C++--模板的概念和意义、深入理解函数模板、类模板的概念和意义

一.模板的概念与意义 Q:C++中有几种交换变量的方法?定义宏代码与定义函数A.定义宏代码优点:代码复用,适合所有的类型缺点:编译器不知道宏的存在,缺少类型检查B.定义函数优点:真正的函数调用,编译器对类型进行检查缺点:根据类型重复定义函数,无法代码复用 C.泛型编程--不考虑具体数据类型的编程方式Swap泛型写法中的T不是一个具体的数据类型,而是泛指任意的数据类型C++中的泛型编程函数模板--一种特殊的函数可用不同类型进行调用,看起来和普通函数很相似,区别是类型可被参数化函数模板的语法规则1.

协方差矩阵的定义及意义

协方差矩阵的定义 设一个随机向量为\(\mathbf{x} \in \mathbb{R}^\mathrm{N}\),其均值为\(\bar{\mathbf{x}}\),则令\(\mathbf{y} = \mathbf{x} - \bar{\mathbf{x}}\),则随机向量\(\mathbf{x}\)的协方差定义为: \[ \Sigma_{\mathbf{x}} = \begin{bmatrix} \sigma(x_1,x_1) & \dotsb & \sigma(x_1,x_N) \ \

第49课 多态的概念和意义

1. 函数重写回顾 (1)父类中被重写的函数依然会继承给子类 (2)子类中重写的函数将覆盖父类中的函数 (3)通过作用域分辨符(::)可以访问到父类中的函数 Child c; Parent* p = &c; c.Parent::print(); //从父类中继承 c.print(); //在子类中重写 p->print(); //父类中定义 2. 面向对象中期望的行为 (1)根据实际的对象类型判断如何调用重写函数 (2)父类指针(引用) ①指向父类对象时,则调用父类中定义的函数 ②指向子类对

设计模式的学习(一)-软件设计模式的概念与意义以及23种设计模式的简单介绍

有关软件设计模式的定义有很多,有些是从模式的作用出发,也写是根据模式的特点,本文根据大多数教材定义,从以下两个方面来说明. 软件模式的概念.软件设计模式(Software Design Pattern),又称设计模式,是一套被反复使用,多数人知晓,经过分类编目.代码设计经验的总结.它描述了在软件设计过程中的一些不断重复发生的问题,以及对该问题的解决方案.也就是说,它是解决特定问题的一系列套路,是前辈们代码设计经验的总结,具有一定的普遍性,可以反复使用.目的是为了提高代码的可重用性,代码的可读性和

第43课 继承的概念及意义

1. 类之间的组合关系 (1)组合关系:整体与部分的关系 [实例分析]组合关系的描述 #include <iostream> using namespace std; //内存类 class Memory { public: Memory() { cout << "Memory()" << endl; } ~Memory() { cout << "~Memory()" << endl; } }; //硬盘类