一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/

涉及到概率的一个重要的操作是寻找函数的加权平均值。在概率分布p(x)下,函数f(x)的平均值被称为f(x)的期望(expectation),记作E[f]。对于一个离散变量,它的定义为:

因此平均值根据x的不同值的相对概率加权。在连续变量的情形下,期望以对应的概率密度的积分的形式表示:

类似的,我们有“条件期望”。无非就是把边缘概率变成条件概率。

在连续变量的情况下,我们把求和改成积分就好了。

如果我们给定有限数量的N 个点,这些点满足某个概率分布或者概率密度函数,那么期望可以通过平均的方式估计:

可以看出,当点数足够多,即N趋向于无穷大的时候,估计变得精准。

f(x)的方差被定义为:

方差是干什么的呢,它度量了f(x)在均值E[f(x)]附近变化性的大小。

我们可以把期望大概看成一个不错的平均值吧。

如果我们把方差展开,则会得到一个关于f(x)和f(x)2的期望的式子

我不是很知道这一步是为什么,不管了。

当然了,我们不仅可以关心函数,更可以关心我们的自变量本身,于是有:

有一个变量的方差,我们就有两个变量的方差,在这里我们称之为“协方差”,它是这么定义的:

看起来和方差长得一模一样。同理,我也不懂这是怎么展开的。

那么协方差是干什么用的呢?它表示在多大程度上x和y会共同变化。也就是说,如果x,y相互独立,x和y的协方差就是0。还记得篮子和苹果的例子吗?

有两个变量的协方差,我们就有向量的协方差,它是这么定义的:

可以看出,两个向量的协方差是个矩阵。每两个元素一一对应求协方差。

当这两个向量长得一样的时候,其实就是求自己和自己的协方差,我们有一个偷懒的记号:

那么这个表示一个向量内元素之间共同变化的程度。等以后配合上实例再谈这些应该会更好一些。

时间: 2024-08-02 15:10:47

一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差的相关文章

一起啃PRML - 1.2.1 Probability densities

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 我们之前一直在讨论“谁取到什么”这样的概率问题,现在我们不妨来研究“谁取到哪个范围内”这样的概率问题. x位于区间(a, b)的概率由下式给出: 由于概率是非负的,并且x的值一定位于实数轴上得某个位置,因此概率密度一定满足下面两个条件: 位于区间(−∞, z)的x的概率由累积分布函数(cumulative distribution function)给出.定义为: 累积分布函数与概率密度函数的关系:

一起啃PRML - 1.2 Probability Theory

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ A key concept in the field of pattern recognition is that of uncertainty. 可以看出概率论在模式识别显然是非常重要的一大块. 读其他书的时候在概率这方面就也很纠结过. 我们也还是通过一个例子来理解一下Probability Theory里面一些重要的概念. Imagine we have two boxes, one red a

一起啃PRML - 1.1 Example: Polynomial Curve Fitting

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 前言:真是太糟糕了,本地的公式和图片粘上来全都喂汪了... We begin by introducing a simple regression problem, 用一个例子穿起这些零碎的知识点. 回顾最前面的Mathematical Notation: A superscript T denotes the transpose of a matrix or vector, so that xT

一起啃PRML - 1.2.4 The Gaussian distribution 高斯分布 正态分布

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 我们将用整个第二章来研究各种各样的概率分布以及它们的性质.然而,在这里介绍连续变量一种最重要的概率分布是很方便的.这种分布就是正态分布(normal distribution)或者高斯分布(Gaussian distribution).在其余章节中(事实上在整本书中),我们将会经常用到这种分布. 正态分布是这么定义的: 图像长成这样: 我们待会被数学折磨完后再来了解这些参数的意义. 先来看看正态分布

CCJ PRML Study Note - Chapter 1.2 : Probability Theory

Chapter 1.2 : Probability Theory Chapter 1.2 : Probability Theory Christopher M. Bishop, PRML, Chapter 1 Introdcution Chapter 1.2 : Probability Theory 1. Uncertainty 2. Example discussed through this chapter 3. Basic Terminology 3.1 Probability densi

PRML 02 Introduction:贝叶斯概率

引言 概率密度 期望和协方差 Expectations and covariances 1加权平均值 2 多变量权重 3 条件期望 4 函数方差 5 协方差 Bayesian Probability 5高斯分布 重回多项式拟合 1理解误差函数 2 理解规则化 贝叶斯曲线拟合 主要讲解了贝叶斯概率与统计派概率的不同.概率论,决策论,信息论(probability theory, decision theory, and information theory)是以后用到的三个重要工具,本节主要介绍概

EM 算法 实例

#coding:utf-8 import math import copy import numpy as np import matplotlib.pyplot as plt isdebug = True #指定k个高斯分布参数,这里指定k=2. #注意2个高斯分布具有相同方差Sigma,均值分别为Mu1,Mu2. #共1000个数据 #生成训练样本,输入6,40,20,2 #两类样本方差为6, #一类均值为20,一类为40 #随机生成1000个数 def ini_data(Sigma,Mu1

3 Mental Habits Making You Miserable

喜欢一篇文章,原文链接:https://nickwignall.com/mental-habits-making-you-miserable/?utm_source=quora&utm_medium=referral We all want to be happier. We search our lives for the next big idea, the next fancy promotion, or the next person in our life who is going t

统计学一些名称中英文对照

奥卡姆剃刀:Occam's razor 半监督学习:semi-supervised learning 标注:tagging 不完全数据:incomplete-data 参数空间:parameter space 残差:residual 测试集:test set 测试数据:test data 测试误差:test error 策略:strategy 成对马可尔可夫性:pairwise Markov property 词性标注:part of speech tagging 代价函数:cost funct