高斯函数和正态分布

高斯函数与正态分布

高斯函数或者说正态分布函数在很多场合都得到广泛应用,其是概率论和统计学的核心,在最大似然估计、贝叶斯估计中必不可少。其也是稀疏贝叶斯估计的重要基础。下面对高斯函数的一些基本知识点进行归纳和总结,不当之处,欢迎批评指正。

(1) 高斯函数

高斯函数定义如下
\begin{equation}
f(x)=aexp(-\frac{(x-b)^2}{2c^2})
\end{equation}
其中$a$, $b$,$c$ 为对应的参数。高斯函数是一个钟形曲线。其中参数$a$控制函数的幅度,参数$b$控制钟形曲线的水平位置,参数$c$反应钟形曲线钟的宽度。

(2) 一维正态分布
令$a=\frac{1}{\sqrt{2\pi}\sigma}$, $b=\mu$, $c=\sigma$, 可得一维随机变量$x$高斯概率密度函数为
\begin{equation}
f(x)=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{(x-\mu)^2}{2\sigma^2})
\end{equation}
其中$\mu$,$\sigma^2$分别表示均值和方差。当$\mu=0$以及$\sigma=1$时,即为标准正态分布。此时
\begin{equation}
f(x)=\frac{1}{\sqrt{2\pi}}exp(-\frac{x^2}{2})
\end{equation}
由高斯概率密度函数的定义知
\begin{equation}
\int_{-\infty}^{+\infty}e^{-\frac{(x-\mu)^2}{2\sigma^2}}dx=\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2\sigma^2}}dx=\sqrt{2\pi}\sigma
\end{equation}
以及
\begin{equation}
\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}dx=\sqrt{2\pi}
\end{equation}
当然上述结果也可以由积分得到。比如令$s=\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}dx$,则$s^2=\int_{-\infty}^{+\infty}e^{-\frac{x^2}{2}}dx\int_{-\infty}^{+\infty}e^{-\frac{y^2}{2}}dy=\int_{-\infty}^{\infty}{\int_{-\infty}^{+\infty}e^{-\frac{x^2+y^2}{2}}}dxdy=\int_{0}^{2\pi}\int_{0}^{+\infty}e^{-\frac{r^2}{2}}rdrd\theta=2\pi$,故得到上述结果。

均值决定高斯分布密度函数的位置,方差反应随机变量偏离均值的距离。方差越大,概率密度函数越平坦,方差越小,概率密度函数越尖锐、窄小,如下图所示。

(3)多维高斯分布的概率密度函数

任意$N$维随机变量高斯概率密度函数可以由多维独立随机变量的概率密度函数导出,例如令$\bm{y}=\bm{A}(\bm{x}-\bm{\mu})$,用$\mu$进行平移,矩阵$\bm{A}$进行相关变换。具体过程忽略,可参考知乎或相关博客讲解。$N$维高斯分布的概率密度函数如下
\begin{equation}
f(\bm{x})=(2\pi)^{-\frac{N}{2}}\left| \bm{\Sigma}\right| ^{-\frac{1}{2}}exp[-\frac{1}{2}(\bm{x}-\bm{\mu})^T\Sigma^{-1}(\bm{x}-\bm{\mu})]
\end{equation}
式中$\bm{\mu}$表示均值向量,$\bm{\Sigma}$表示协方差矩阵。指数部分可以写成另外的形式$L=-\frac{1}{2}(\bm{x}-\bm{\mu})^T\Sigma^{-1}(\bm{x}-\bm{\mu})=-\frac{1}{2}(\bm{x}^T\bm{\Sigma}^{-1}\bm{x}-2\bm{\mu}^T\bm{\Sigma}^{-1}\bm{x}+\bm{\mu}^T\bm{\Sigma}^{-1}\bm{\mu})$

两个及多个高斯分布的乘积
(1) 两个高斯概率密度函数的乘积

现有两个高斯函数分布,分别可以表示为$f(x;\mu_1,\sigma_1)=\frac{1}{\sqrt{2\pi}\sigma_1}exp(-\frac{(x-\mu_1)^2}{2\sigma_1^2})$以及为$f(x;\mu_2,\sigma_2)=\frac{1}{\sqrt{2\pi}\sigma_2}exp(-\frac{(x-\mu_2)^2}{2\sigma_2^2})$,则它们的乘积可以表示为
\begin{equation}
g(x)=f(x;\mu_1,\sigma_1)f(x;\mu_2,\sigma_2)=\frac{1}{2\pi\sigma_1\sigma_2}exp(-\frac{(x-\mu_1)^2}{2\sigma_1^2}-\frac{(x-\mu_2)^2}{2\sigma_2^2})
\end{equation}
令$L=-\frac{(x-\mu_1)^2}{2\sigma_1^2}-\frac{(x-\mu_2)^2}{2\sigma_2^2}$,可采用配方法得到高斯密度函数的形式,这里采用求导法。很明显高斯密度函数的指数部分的一阶导数在均值处有零点,二阶导数与方差的倒数(多维向量为协方差矩阵的逆)成正比,正比系数为-1。令
\begin{equation}
\frac{dL}{dx}=-\frac{x-\mu_1}{2\sigma_1^2}-\frac{x-\mu_2}{2\sigma_2^2}=0
\end{equation}
得出$x=\frac{\frac{\mu_1}{\sigma_1^2}+\frac{\mu_2}{\sigma_2^2}}{\frac{1}{\sigma_1^2}+\frac{1}{\sigma_2^2}}=\frac{\mu_1\sigma_2^2+\mu_2\sigma_1^2}{\sigma_1^2+\sigma_2^2}.$

再令$\Lambda_i=1/\sigma_i^2$, for $i=1,2$,则可以得到新的高斯分布的均值$\mu$为

\begin{equation}
    \mu=\frac{\Lambda_1\mu_1+\Lambda_2\mu_2}{\Lambda_1+\Lambda_2}
\end{equation}
继续求导有$\frac{d^2L}{d^2x}=-\frac{1}{\sigma_1^2}-\frac{1}{\sigma_2^2}$。即新高斯分布的方差应满足
\begin{equation}
    \frac{1}{\sigma^2}=\frac{1}{\sigma_1^2}+\frac{1}{\sigma_2^2}
\end{equation}
所以关于两个高斯概率密度函数的乘积有如下结论:两个高斯概率密度函数的乘积仍然为高斯分布,其均值为原始两个高斯分布的均值加权和,权值为对应方差的倒数;新高斯分布方差的倒数为原始两个高斯分布的方差倒数之和

(2)多个高斯概率密度函数的乘积

上述结论可以推广到多个高斯概率密度函数的乘积。假设有$f(x_i;\mu_i,\sigma_i^2)$,$i=1,2,\dots,N$,令
\begin{equation}
    g(x)=\prod_{i=1}^{N}(f(x_i;\mu_i,\sigma_i^2))
\end{equation}
则$g(x)$也是一个高斯函数,其均值方差满足
\begin{equation}
\left\{
    \begin{aligned}
    \mu & = \frac{\sum_{i=1}^{N}\Lambda_i\mu_i}{\sum_{i=1}^{N}\Lambda_i}\\
    \Lambda & = \sum_{i=1}^{N}\Lambda_i
    \end{aligned}
\right.
\end{equation}
其中$\Lambda_i=1/\sigma_i^2$为第$i$个高斯函数的方差的倒数。

(3)多个多维高斯密度函数的乘积

首先多维高斯概率密度函数$f(\bm{x})=exp\{-\frac{1}{2}(\bm{x}^T\bm{\Sigma}^{-1}\bm{x}-2\bm{\mu}^T\bm{\Sigma}^{-1}\bm{x}+\bm{\mu}^T\bm{\Sigma}^{-1}\bm{\mu})\}$可以写成
\begin{equation}
    f(\bm{x})=exp[\bm{\zeta}+\bm{\eta}^T\bm{x}-\frac{1}{2}\bm{x}^T\bm{\Psi x}]
\end{equation}
其中$\bm{\Psi}=\Sigma^{-1}$,$\bm{\eta}=\Sigma^{-1}\mu$,$\zeta=-\frac{1}{2}(Nln(2\pi)-ln\Psi+\bm{\eta}^T\bm{\Psi}^{-1}\bm{\eta})$。现假设有$N$个高斯分布的概率密度函数$f_i(x)=exp[\bm{\zeta}^i+\bm{\eta}_i^T\bm{x}-\frac{1}{2}\bm{x}^T\bm{\Psi}_i\bm{x}]$,其乘积为
\begin{equation}
    g(\bm{x})=\prod_{i=1}^Nf_i(\bm{x})=exp\left[\sum_{i=1}^{N}\zeta_i+(\sum_{i=1}^{N}\bm{\eta}_i^T)\bm{x}-\frac{1}{2}\bm{x}^T(\sum_{i=1}^{N}\bm{\Psi}_i)\bm{x}\right]
\end{equation}
令$\bm{\Psi}=\sum_{i=1}^{N}\bm{\Psi_i}$,
$\bm{\eta}=\sum_{i=1}^{N}\bm{\eta_i}=\sum_{i=1}^{N}\bm{\Sigma}_i^{-1}\mu_i=\sum_{i=1}^{N}\bm{\Psi_i\mu_i}\triangleq\bm{\Psi\mu}$时,$g(\bm{x})$可以进一步写成
\begin{equation}
    g(\bm{x})=exp(-\bm{\zeta}+\sum_{i=1}^{N}\bm{\zeta_i})exp(\bm{\zeta}+\bm{\eta}^T\bm{x}-\frac{1}{2}\bm{x}^T\bm{\Psi}^T\bm{x})
\end{equation}
其中$\zeta=-\frac{1}{2}(Nln(2\pi)-ln\Psi+\bm{\eta}^T\bm{\Psi}^{-1}\bm{\eta})$
\\可以得出结论:多个多维高斯分布概率密度函数的乘积等于一个高斯分布概率密度函数与一个常数的乘积,也就是一个高斯函数
两个高斯分布的卷积
函数$f(x)$与$g(x)$的卷积为
\begin{equation}
    f(x)\otimes g(x)=\int_{-\infty}^{+\infty}f(x-\tau)g(\tau)d\tau
\end{equation}
这里要用到傅里叶变换及卷积定理,卷积定理简单说是指时域的卷积等于频域的乘积。

假设$f(x)=\frac{1}{\sqrt{2\pi}\sigma_f}exp[-\frac{(x-\mu_f)^2}{2\sigma_f^2}]$,$g(x)=\frac{1}{\sqrt{2\pi}\sigma_g}exp[-\frac{(x-\mu_g)^2}{2\sigma_g^2}]$,有
\begin{equation}
F(f(x))=\int_{-\infty}^{+\infty}f(x)e^{-j\omega x}dx=\frac{1}{\sqrt{2\pi}\sigma_f}\int_{-\infty}^{+\infty}exp[-\frac{(x-\mu_f)^2}{2\sigma_f^2}]exp(-j\omega x)dx
\end{equation}
令$x-\mu_f=t$,则
\begin{equation}
\begin{aligned}
F(f(x))&=\frac{exp(j\omega \mu_f)}{\sqrt{2\pi}\sigma_f}\int_{-\infty}^{+\infty}exp(-\frac{t^2}{2\sigma_f^2})exp(-j\omega t)dt\\
&=\frac{2exp(j\omega \mu_f)}{\sqrt{2\pi}\sigma_f}\int_{0}^{+\infty}exp(-\frac{t^2}{2\sigma_f^2})cos(\omega t)dt
\end{aligned}
.
\end{equation}
由积分$\int_{0}^{+\infty}e^{-at^2}cos(2xt)dt=\frac{1}{2}\sqrt{\frac{\pi}{a}}e^{-\frac{x^2}{a}}$可得
\begin{equation}
F(f(x))=e^{j\omega \mu_f}e^{-\frac{\omega^2\sigma_f^2}{2}}
\end{equation}
可以看出高斯概率密度函数的傅里叶变换仍然是一个高斯分布。进一步有
\begin{equation}
F(f(x))F(g(x))=e^{j\omega(\mu_f+\mu_g)}e^{-\frac{\omega^2(\sigma_f^2+\sigma_g^2)}{2}}
\end{equation}
根据卷积定理有,
\begin{equation}
f(x)\otimes g(x)=F^{-1}(F(f(x))F(g(x)))=\frac{1}{\sqrt{2\pi}(\sigma_f+\sigma_g)}exp[-\frac{(x-(\mu_f+\mu_g)^2)}{2(\sigma_f^2+\sigma_g^2)}]
\end{equation}
即可得出结论:两个高斯分布的卷积仍然是一个高斯分布,新高斯分布的均值为原有高斯分布均值之和,方差为原有两个高斯分布的方差和。

Reference

[1] P.A.Bromiley. Products and Convolutions of Gaussian Probability Density Functions.2018

 附录
 A1、关于求导的一些相关性质,在最大似然估计等地方可能用到。
 \begin{equation}
 \frac{\partial(\bm{AB})}{\partial x}=\frac{\partial \bm{A}}{\partial x}\bm{B}+\bm{A}\frac{\partial \bm{B}}{\partial x}
 \end{equation}
\begin{equation}
\frac{\partial}{\partial x}\bm{A}^{-1}=-\bm{A}^{-1}\frac{\partial \bm{A}}{\partial x}\bm{\bm(A)}^{-1}
\end{equation}
\begin{equation}
\frac{\partial}{\partial x}ln\left| \bm{A}\right| =(\bm{A}^{-1})^T
\end{equation}
A2、关于求解高斯分布的概率密度函数的均值和方差
\\
假如有如下高斯分布,$f(x)=\frac{1}{\sqrt{2\pi}\sigma_1}e^{-\frac{(x-\mu_1)^2}{2\sigma_1^2}}$,令指数$L=-\frac{(x-\mu_1)^2}{2\sigma_1^2}$,显然指数$L$的一阶导数在均值$\mu$处有零点。二阶导数恰好为方差的倒数的相反数$-1/\sigma_1^2$。结果同样适用于多维高斯分布,此时二阶导数应为协方差矩阵的逆的相反数。

原文地址:https://www.cnblogs.com/shuangli0824/p/10854560.html

时间: 2024-10-10 07:50:14

高斯函数和正态分布的相关文章

再谈正态分布或高斯函数

它的历史不知道,如何推导出来的,没管啊,不过我很有兴趣看看啊,但没有看.高斯函数的用处太多了: 首先说明一点哦:正态分布是高斯函数的积分为1的情况: 一维情况下: 一维高斯高斯函数的公式: 而正态分布的公式表示为: 它们的区别仅仅在于前面的系数不一样:正态分布之所以需要这样的系数是为了在区间的积分为1:由此也可以看出:的在区间的积分为 . 所以呢,高斯函数的关键就是那个指数函数形式: 另外:指明了锋值的位置:控制着曲线的形状,越小,曲线越陡峭: 注意1:在正态分布中,经常用于标准的正态分布:即服

高斯函数以及在图像处理中的应用总结

1.一维高斯函数: a表示得到曲线的高度,b是指曲线在x轴的中心,c指width(与半峰全宽有关),图形如下: . 2.根据一维高斯函数,可以推导得到二维高斯函数: 在图形上,正态分布是一种钟形曲线,越接近中心,取值越大,越远离中心,取值越小. 计算平均值的时候,我们只需要将"中心点"作为原点,其他点按照其在正态曲线上的位置,分配权重,就可以得到一个加权平均值.常用作图像平滑操作. 例如:通常,图像处理软件会提供"模糊"(blur)滤镜,使图片产生模糊的效果. &q

伽马函数常用性质总结以及高斯函数的矩母函数公式推导(随机过程)

\(\Gamma\)函数的定义 在实数域上伽马函数定义为: \[ \Gamma(x)=\int_0^{+\infty}t^{x-1}e^{-t}dt(x>0) \] 另外一种写法: \[ \Gamma(x)=2\int_0^{+\infty}t^{2x-1}e^{-t^2}dt \] 在复数域上伽马函数定义为: \[ \Gamma(x)=\int_0^{+\infty}t^{z-1}e^{-t}dt \] \(\Gamma\)函数常用性质 \(\Gamma(x+1)=\lim\limits_{N

图像处理之项目---csdn去雾专栏

(一)高斯低通滤波去噪 高斯低通滤波器(Gaussian Low Pass Filter)是一类传递函数为高斯函数的线性平滑滤波器.又由于高斯函数是正态分布的密度函数.因此高斯低通滤波器对于去除服从正态分布(Normal distribution)的噪声非常有效.一维高斯函数和二维高斯函数 (高斯低通滤波器的传递函数) 的表达形式分别如下: 公式中,为标准差,由于图像通常是二维信号,因此图像去噪通常使用二维高斯函数作为传递函数,而高斯函数具有可分离的特性,因此可以先对行进行高斯滤波,再对列进行高

图像处理URL

随笔分类 - 图像处理/图像增强等 图像增强: 图像复原: 图像重建: 图像分割: 图像特效: 图像匹配: 图像形态学处理: 图像几何处理: 图像正交变换: 人工智能: 跟踪: 图像处理之增强---图像模糊检测 摘要: 这种检测可以做宽动态的检测,也可应用稳像算法我们实现了拉普拉斯方差算法,该算法提供给我们一个浮点数来代表具体图像的"模糊度".该算法快速,简单且易于使用--用拉普拉斯算子与输入图像做卷积然后计算方差即可.如果方差低于预定义阈值,图像就被标记为"模糊"

高斯背景建模之icvMatchTest函数篇

//对每个象素点进行匹配 static int icvMatchTest( double* src_pixel, int nChannels, int* match, const CvGaussBGPoint* g_point, const CvGaussBGStatModelParams *bg_model_params ) { int k; int matchPosition=-1; //这个匹配的位置只能是0,1,2(在假设3个高斯的前提下) for ( k = 0; k < bg_mod

学习 opencv---(7) 线性邻域滤波专场:方框滤波,均值滤波,高斯滤波

本篇文章中,我们一起仔细探讨了OpenCV图像处理技术中比较热门的图像滤波操作.图像滤波系列文章浅墨准备花两次更新的时间来讲,此为上篇,为大家剖析了"方框滤波","均值滤波","高斯滤波"三种常见的邻域滤波操作.而作为非线性滤波的"中值滤波"和"双边滤波",我们下次再分析. 因为文章很长,如果详细啃的话,或许会消化不良.在这里给大家一个指引,如果是单单想要掌握这篇文章中讲解的OpenCV线性滤波相关的三个函

SIFT四部曲之——高斯滤波

本文为原创作品,未经本人同意,禁止转载 欢迎关注我的博客:http://blog.csdn.net/hit2015spring和http://www.cnblogs.com/xujianqing/ 或许网络上有各位牛人已经对sift算法进行各种的详解和说明,我(小菜鸟)在翻阅各种资料和对opencv中的代码进行反推之后,终于理解该算法.并记录之,供大家一起交流学习!这个博文主要记录了我的学习历程,或许对你有帮助,或许可以启发你,或许你只是一笑而过!没关系,至少自己总结过. 这篇文章主要是对sif

图像滤波之高斯滤波介绍

1 高斯滤波简介 了解高斯滤波之前,我们首先熟悉一下高斯噪声.高斯噪声是指它的概率密度函数服从高斯分布(即正态分布)的一类噪声.如果一个噪声,它的幅度分布服从高斯分布,而它的功率谱密度又是均匀分布的,则称它为高斯白噪声.高斯白噪声的二阶矩不相关,一阶矩为常数,是指先后信号在时间上的相关性,高斯白噪声包括热噪声和散粒噪声. 高斯滤波器是一类根据高斯函数的形状来选择权值的线性平滑滤波器.高斯平滑滤波器对于抑制服从正态分布的噪声非常有效.一维零均值高斯函数为: g(x)=exp( -x^2/(2 si