一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/

涉及到概率的一个重要的操作是寻找函数的加权平均值。在概率分布p(x)下,函数f(x)的平均值被称为f(x)的期望(expectation),记作E[f]。对于一个离散变量,它的定义为：

因此平均值根据x的不同值的相对概率加权。在连续变量的情形下,期望以对应的概率密度的积分的形式表示：

类似的，我们有“条件期望”。无非就是把边缘概率变成条件概率。

在连续变量的情况下，我们把求和改成积分就好了。

如果我们给定有限数量的N 个点,这些点满足某个概率分布或者概率密度函数,那么期望可以通过平均的方式估计：

可以看出，当点数足够多，即N趋向于无穷大的时候，估计变得精准。

f(x)的方差被定义为：

方差是干什么的呢，它度量了f(x)在均值E[f(x)]附近变化性的大小。

我们可以把期望大概看成一个不错的平均值吧。

如果我们把方差展开，则会得到一个关于f(x)和f(x)2的期望的式子

我不是很知道这一步是为什么，不管了。

当然了，我们不仅可以关心函数，更可以关心我们的自变量本身，于是有：

有一个变量的方差，我们就有两个变量的方差，在这里我们称之为“协方差”，它是这么定义的：

看起来和方差长得一模一样。同理，我也不懂这是怎么展开的。

那么协方差是干什么用的呢？它表示在多大程度上x和y会共同变化。也就是说，如果x,y相互独立，x和y的协方差就是0。还记得篮子和苹果的例子吗？

有两个变量的协方差，我们就有向量的协方差，它是这么定义的：

可以看出，两个向量的协方差是个矩阵。每两个元素一一对应求协方差。

当这两个向量长得一样的时候，其实就是求自己和自己的协方差，我们有一个偷懒的记号：

那么这个表示一个向量内元素之间共同变化的程度。等以后配合上实例再谈这些应该会更好一些。

时间： 2024-08-02 15:10:47

一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差的相关文章

一起啃PRML - 1.2.1 Probability densities

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 我们之前一直在讨论“谁取到什么”这样的概率问题,现在我们不妨来研究“谁取到哪个范围内”这样的概率问题. x位于区间(a, b)的概率由下式给出: 由于概率是非负的,并且x的值一定位于实数轴上得某个位置,因此概率密度一定满足下面两个条件: 位于区间(−∞, z)的x的概率由累积分布函数(cumulative distribution function)给出.定义为: 累积分布函数与概率密度函数的关系:

一起啃PRML - 1.2 Probability Theory

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ A key concept in the field of pattern recognition is that of uncertainty. 可以看出概率论在模式识别显然是非常重要的一大块. 读其他书的时候在概率这方面就也很纠结过. 我们也还是通过一个例子来理解一下Probability Theory里面一些重要的概念. Imagine we have two boxes, one red a

一起啃PRML - 1.1 Example: Polynomial Curve Fitting

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 前言:真是太糟糕了,本地的公式和图片粘上来全都喂汪了... We begin by introducing a simple regression problem, 用一个例子穿起这些零碎的知识点. 回顾最前面的Mathematical Notation: A superscript T denotes the transpose of a matrix or vector, so that xT

一起啃PRML - 1.2.4 The Gaussian distribution 高斯分布正态分布

@copyright 转载请注明出处 http://www.cnblogs.com/chxer/ 我们将用整个第二章来研究各种各样的概率分布以及它们的性质.然而,在这里介绍连续变量一种最重要的概率分布是很方便的.这种分布就是正态分布(normal distribution)或者高斯分布(Gaussian distribution).在其余章节中(事实上在整本书中),我们将会经常用到这种分布. 正态分布是这么定义的: 图像长成这样: 我们待会被数学折磨完后再来了解这些参数的意义. 先来看看正态分布

CCJ PRML Study Note - Chapter 1.2 : Probability Theory

Chapter 1.2 : Probability Theory Chapter 1.2 : Probability Theory Christopher M. Bishop, PRML, Chapter 1 Introdcution Chapter 1.2 : Probability Theory 1. Uncertainty 2. Example discussed through this chapter 3. Basic Terminology 3.1 Probability densi

PRML 02 Introduction：贝叶斯概率

引言概率密度期望和协方差 Expectations and covariances 1加权平均值 2 多变量权重 3 条件期望 4 函数方差 5 协方差 Bayesian Probability 5高斯分布重回多项式拟合 1理解误差函数 2 理解规则化贝叶斯曲线拟合主要讲解了贝叶斯概率与统计派概率的不同.概率论,决策论,信息论(probability theory, decision theory, and information theory)是以后用到的三个重要工具,本节主要介绍概

EM 算法实例

#coding:utf-8 import math import copy import numpy as np import matplotlib.pyplot as plt isdebug = True #指定k个高斯分布参数,这里指定k=2. #注意2个高斯分布具有相同方差Sigma,均值分别为Mu1,Mu2. #共1000个数据 #生成训练样本,输入6,40,20,2 #两类样本方差为6, #一类均值为20,一类为40 #随机生成1000个数 def ini_data(Sigma,Mu1

3 Mental Habits Making You Miserable

喜欢一篇文章,原文链接:https://nickwignall.com/mental-habits-making-you-miserable/?utm_source=quora&utm_medium=referral We all want to be happier. We search our lives for the next big idea, the next fancy promotion, or the next person in our life who is going t

统计学一些名称中英文对照

奥卡姆剃刀:Occam's razor 半监督学习:semi-supervised learning 标注:tagging 不完全数据:incomplete-data 参数空间:parameter space 残差:residual 测试集:test set 测试数据:test data 测试误差:test error 策略:strategy 成对马可尔可夫性:pairwise Markov property 词性标注:part of speech tagging 代价函数:cost funct