数字特征:协方差 & 相关系数

【引入】

对于二维随机变量 $(X,Y)$ ,我们除了讨论 $X$ 与 $Y$ 的数学期望和方差除外,

还需要讨论描述 $X$ 与 $Y$ 之间相互关系的数字特征。

在《数字特征:方差》方差性质3的证明中,我们已经看到,

如果两个随机变量 $X$ 与 $Y$ 是相互独立的,则 $E\{ [X-E(X)][Y-E(Y)]\} =0$

这意味着当 $E\{ [X-E(X)][Y-E(Y)]\} \neq 0$ 时, $X$ 与 $Y$ 不相互独立,而是存在一定的关系的。

【定义】

量 $E\{ [X-E(X)][Y-E(Y)]\}$ 称为随机变量 $X$ 与 $Y$ 的协方差,记为 $Cov(X,Y)$

$$Cov(X,Y)=E\{ [X-E(X)][Y-E(Y)]\}$$

$$\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}$$

称为随机变量 $X$ 与 $Y$的相关系数

由定义,即知

$$Cov(X,Y)=Cov(Y,X),\quad Cov(X,X)=D(X)$$

由上述定义及(2.5)式知道,对于任意两个随机变量 $X$ 与 $Y$ ,下列等式成立

$$D(X+Y)=D(X)+D(Y)+2Cov(X,Y)\tag{3.1}$$

将 $Coc(X,Y)$ 的定义式展开,易得

$$Cov(X,Y)=E(XY)-E(X)E(Y)\tag{3.2}$$

我们常常用这一式子计算协方差。



协方差的性质:

1. $Cov(aX,bY)=abCov(X,Y),a,b是常数$

2. $Cov(X_1+X_2,Y)=Cov(X_1,Y)+Cov(X_2,Y)$



下面我们来推导 $\rho_{XY}$ 的两条重要性质,并说明 $\rho_{XY}$ 的含义

考虑以 $X$ 的线性函数 $a+bX$ 来近似表示 $Y$ 。

我们以均方误差

$$e=E[(Y-(a+bX))^2]\qquad \qquad \qquad \qquad \qquad \qquad \qquad \qquad \quad \ $$

$$=E(Y^2)+b^2E(X^2)+a^2-2bE(XY)+2abE(X)-2aE(Y)\tag{3.3}$$

来衡量以 $a+bX$ 近似表达 $Y$ 的好坏程度。

$e$ 的值越小表示 $a+bX$ 与 $Y$ 的近似程度越好。

这样,我们就取 $a,b$ 使 $e$ 取到最小。下面就来求最佳近似式 $a+bX$ 中的 $a,b$ 。为此,将 $e$ 分别关于 $a,b$ 求偏导数,并令它们等于零,得

$$\begin{cases}\frac{\partial e}{\partial a}=2a+2bE(X)-2E(Y)=0,\\ \frac{\partial e}{\partial b}=2bE(X^2)-2E(XY)+2aE(X)=0\end{cases}$$

原文地址:https://www.cnblogs.com/ForTech/p/8605844.html

时间: 2024-08-30 16:14:07

数字特征:协方差 & 相关系数的相关文章

R语言结合概率统计的体系分析---数字特征

现在有一个人,如何对这个人怎么识别这个人?那么就对其存在的特征进行提取,比如,提取其身高,其相貌,其年龄,分析这些特征,从而确定了,这个人就是这个人,我们绝不会认错. 同理,对数据进行分析,也是提取出数据的特征,对其特征进行分析,从而确定这些数据所呈现的信息状况,从而确定了这些数据的独特性和唯一性,因为他呈现的信息是唯一的,绝不与别的是相同的. 那么这些特征是什么呢?拥有哪些特征呢?似乎应该是经过无数科学家的总结,终于发现了几个重要的特征,包括数字特征和分布特征,这个数字特征,包括集中位置,分散

伯努利分布详解(包含该分布数字特征的详细推导步骤)

Bernouli Distribution(中文翻译称伯努利分布) 该分布研究的是一种特殊的实验,这种实验只有两个结果要么成功要么失败,且每次实验是独立的并每次实验都有固定的成功概率p. 概率公式可以表示为  , x只能为0或者1,即要么成功要么失败 根据数学期望的性质 由于这里x只有两个取值所以该分布的数学期望为 方差则可以由方差公式来计算 方差公式:  该分布显然, 因此可以得到, 所以方差  最后我们来推导该分布的最大似然估计 是这样定义的,假设我们做了N次实验,得到的结果集合为 ,我们想

常用统计数字特征及解析工具

母函数 母函数定义 考虑只取非负值的离散型随机分布,如二项分布,泊松分布,几何分布等,称之为整值随机变量.而有一种变换方法比较适于变换,即母函数法. 对于整值随机变量 \(\xi\) ,根据佚名统计学家公式,定义母函数为 \(P(s)=Es^{\xi}=\sum_{k=0}^\infty p_ks^k\) ,当 \(|s|\le1\)时,\(P(s)\) 一致收敛且绝对收敛,所以母函数对任何整值随机变量都存在. 二项分布母函数: \(P(s)=(q+ps)^n\) 泊松分布母函数: \(P(s)

噪声信号的波形和数字特征和频谱图

噪声信号的波形和数字特征 频谱图: 原文地址:https://www.cnblogs.com/nowroot/p/12425074.html

c语言程序设计第3周编程作业(数字特征)

题目内容: 对数字求特征值是常用的编码算法,奇偶特征是一种简单的特征值.对于一个整数,从个位开始对每一位数字编号,个位是1号,十位是2号,以此类推.这个整数在第n位上的数字记作x,如果x和n的奇偶性相同,则记下一个1,否则记下一个0.按照整数的顺序把对应位的表示奇偶性的0和1都记录下来,就形成了一个二进制数字.比如,对于342315,这个二进制数字就是001101. 这里的计算可以用下面的表格来表示: 数字 3 4 2 3 1 5 数位 6 5 4 3 2 1 数字奇偶 奇 偶 偶 奇 奇 奇

数字特征:方差

[引入] 有一批灯泡,知其平均寿命是 $E(X)=1000$ (小时).仅由这一指标我们还不能判定这批灯泡的质量好坏. 事实上,有可能其中绝大部分灯泡的寿命都在950~1050小时: 也有可能其中约有一半是高质量的,它们的寿命大约有1300小时,另一半却是质量很差的,其寿命大约只有700小时, 为要评定这批灯泡质量的好坏,还需进一步考察灯泡的寿命 $X$ 与其平均值 $E(X)=1000$ 的偏离程度. 若偏离程度较小,表示质量比较稳定.从这个意义上来说,我们认为质量较好. 前面也曾提到在检验棉

『理论』科学计算专项_协方差

一.统计学的基本概念 统计学里最基本的概念就是样本的均值.方差.标准差.首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告诉我们的信息是有限的,而标准差给我们描述的是样本集合的各个样本点到均值的距离之平均. 以这两个集合为例,[0, 8, 12, 20]和[8, 9, 11, 12],两个集合的均值都是10,但显然两个集合的差别是很大的,计算两者的标准差,前者是8.3后者是1.8,显然后者较为集中,故其标准差小一些,标

数学期望、方差、标准差、协方差

数学期望数学期望E(x)完全由随机变量X的概率分布所确定,若X服从某一分布,也称E(x)是这一分布的数学期望.数学期望的定义是实验中每次可能的结果的概率乘以其结果的总和.离散型随机量的数学期望定义:离散型随机变量的所有可能取值?xixi?与其对应的概率?P(xi)?乘积的和为该离散型随机量的数学期望,记为?E(X).公式:E(X)=∑i=1nxiPi连续型随机量的数学期望定义:假设连续型随机变量?XX的概率密度函数为?f(x),如果积分∫+∞?∞xf(x)dx绝对收敛,则称这个积分的值为连续型随

(转载)协方差的意义

数学学了好多年,从学会解各种方程组到计算二重三重积分,从代数到几何,从二维平面到三维空间,从线性代数到概率统计……学会了各种机械的解法,但很多基本概念的意义却不知道.比如说我会很容易的求得一个矩阵的特征值跟特征向量,但是他们到底有什么含义,我们为什么要求一个矩阵的特征值??一头雾水.. 这是在做一个模式识别课堂老师布置的一个作业题时遇到的,协方差矩阵.突然想到协方差,实在忘记了它的意义.看到前人整理过详细的解释,做搬运工没意思,这里引用之,以供自己以后巩固知识. 当 X, Y 的联合分布像上图那