多元高斯分布

  直接给出多元高斯分布和单元高斯分布的概率密度函数:

  

  μ是一个D维均值向量,Σ是一个D×D的协方差矩阵,我们只考虑正定矩阵(所有特征值都是正数),即|Σ|>0;多元高斯分布和单态量高斯分布尽管在形式上不同,但实际上单态高斯是维数为1的多元高斯分布:当D=1时,Σ是一个1×1的矩阵(即退化为一个数),|Σ|1/2=σ(即标准差),Σ-1-2,(x-μ)T=(x-μ),我们能够把这两个公式很好的对应起来。

  在协方差矩阵Σ中,(i,j)元素是X向量中第i个和第j个元素的协方差:  

  我们这里考虑的协方差矩阵都是实对称矩阵根据线性代数理论,所有N×N的实对称矩阵都有N个线性无关的特征向量,并且这些特征向量都可以正交单位化而得到一组正交且模为1的向量(参考wiki谱分解),以二维矩阵为例:

  

  因此,协方差矩阵可以表示为以下形式(x,u一样,都是特征向量的单位正交形式):

  

  又因为中间的是对角矩阵,我们很容易的就可以得到它的逆矩阵:

  

  我们现在回到高斯分布的公式上,定义以下的二次型:

  

  将我们推导的协方差矩阵的拟带入上式,可得:     

  其中再定义:

  

  ==》

  

  其中U是一个正交矩阵;以二维数据为例,高斯分布为一个椭圆曲面(所有特征值为正的情况下),椭圆中心为μ,椭圆轴的方向沿着ui,缩放因子为λ1/2.示意图如下:

  

时间: 2024-12-13 16:06:15

多元高斯分布的相关文章

异常检测: 应用多元高斯分布进行异常检测

多元高斯(正态)分布 多元高斯分布有两个参数u和Σ,u是一个n维向量,Σ协方差矩阵是一个n*n维矩阵.改变u与Σ的值可以得到不同的高斯分布. 参数估计(参数拟合),估计u和Σ的公式如上图所示,u为平均值,Σ为协方差矩阵 使用多元高斯分布来进行异常检测 首先用我我们的训练集来拟合参数u和Σ,从而拟合模型p(x) 拿到一个新的样本,使用p(x)的计算公式计算出p(x)的值,如果p(x)<ε就将它标记为一个异常点 当我们对上图中那个绿色的点进行异常检测时,这些红色的点服从多元高斯正态分布(x1与x2正

数据挖掘算法学习(九)EM算法-上篇-多元高斯分布

------------------------------------------------------------------------------------ 欢迎转载,请附上链接 http://blog.csdn.net/iemyxie/article/details/42560125 ----------------------------------------------------------------------------------- EM算法大致分为两步--E步骤和

高斯分布_简介

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px "Hannotate SC" } p.p2 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px "Hannotate SC"; min-height: 17.0px } span.s1 { } span.Apple-tab-span { white-space: pre } a. 一元高斯分布 b. 多元高斯分布 c.

高斯分布

数据挖掘中的高斯分布 高斯分布,无论是单变量还是多元变量,在统计数据挖掘中是非常有用的,包括一些底层数据假设是高度非高斯的数据挖掘模型.我们需要好好了解多元高斯. 为什么我们应该关注它 高斯像橘子汁和阳光一样是自然存在的 我们需要它来理解贝叶斯最优分类器 我们需要它来理解回归 我们需要它来理解神经网络 我们需要它来理解混合模型 -- PDF(概率密度函数)的熵 分布的熵越大,预测就越困难,压缩就越困难,分布就有越少的尖. 例1."盒子"分布 例2.单位方差"盒子"分

一元高斯分布

在这一节我们将介绍如何使用一元高斯分布对机器人误差进行建模. 在进入正题之前,我们需要首先了解为什么学习高斯分布?什么使得高斯分布有效并且重要?为什么使用高斯分布对噪声和不确定性进行建模(而不是其他概率分布模型,比如均匀分布)? 高斯分布使得只需要两个参数就能确定一个连续的概率分布.这两个参数分别是均值和方差,这很简洁.这也使得高斯分布易于计算和推断. 高斯分布有一些较好的数学性质.例如,两个高斯分布的积还是高斯分布.这使得你在对高斯分布做运算的时候不需要考虑其他的概率分布. 理论上来说,根据中

再谈正态分布或高斯函数

它的历史不知道,如何推导出来的,没管啊,不过我很有兴趣看看啊,但没有看.高斯函数的用处太多了: 首先说明一点哦:正态分布是高斯函数的积分为1的情况: 一维情况下: 一维高斯高斯函数的公式: 而正态分布的公式表示为: 它们的区别仅仅在于前面的系数不一样:正态分布之所以需要这样的系数是为了在区间的积分为1:由此也可以看出:的在区间的积分为 . 所以呢,高斯函数的关键就是那个指数函数形式: 另外:指明了锋值的位置:控制着曲线的形状,越小,曲线越陡峭: 注意1:在正态分布中,经常用于标准的正态分布:即服

史上最全的机器学习资料(上) 转

转自:http://www.afenxi.com/post/18593 摘要: 机器学习牵涉的编程语言十分之广,包括了MATLAB.Python.Clojure.Ruby等等.为了让开发者更加广泛.深入地了解机器学习,云栖社区组织翻译了GitHub Awesome Machine Learning 资源,涵盖24种编程语言的机器学习的框架.库以及其他相关资料. 机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论.统计学.逼近论.凸分析.算法复杂度理论等多门学科.

基于粒子滤波的目标追踪

基于粒子滤波的目标追踪 particle filter object tracking 读"K. Nummiaro, E. Koller-Meier, L. Van Gool. An adaptive color-based particle filter[J], Image and Vision Computing, 2002"笔记 粒子滤波中最重要的一个过程就是重要性重采样, Sampling Importance Resampling (SIR). 这篇博客基于粒子滤波的物体跟踪

斯坦福第十五课:异常检测(Anomaly Detection)

15.1  问题的动机 15.2  高斯分布 15.3  算法 15.4  开发和评价一个异常检测系统 15.5  异常检测与监督学习对比 15.6  选择特征 15.7  多元高斯分布(可选) 15.8  使用多元高斯分布进行异常检测(可选) 15.1  问题的动机 15.2  高斯分布 15.3  算法 15.4  开发和评价一个异常检测系统 15.5  异常检测与监督学习对比 15.6  选择特征 15.7  多元高斯分布(可选) 15.8 使用多元高斯分布进行异常检测(可选)