【机器学习中的数学】比例混合分布

比例混合分布(Scale Mixture Distribution)

混合分布是来自其他随机变量的集合构成的随机变量的概率分布：一个随机变量是根据给定的概率从集合随机选取的，然后所选随机变量的值就得到了( first, a random variable is selected by chance from the collection according to given probabilities of selection, and then the value of the selected random variable is realized)。

当潜在的随机变量是连续的情况下，混合得到的随机变量也是连续的，并且其概率密度函数有时被称作是一个混合密度，其累积分布函数(cumulative distribution function)可以表示成其他分布函数的凸组合(convex combination，i.e. a weighted sum, with non-negative weights that sum to 1)。

有限可数混合体

给定一个有限的概率密度函数集合p1(x),...,pn(x)，或者相对应的累积分布函数P1(x),...,Pn(x)和权值w1,...,wn(wi>=0,sum(wi)=1)，该混合分布可以被表示为密度函数f，或者分布函数F：

这种类型的混合体称作有限混合(finite mixture)。

不可数混合体

当组成的分布式不可数的，这个分布就被称为混合概率分布(compound probability distribution)。这种分布的构造是用积分来代替有限情况下的求和形式。

考虑一个随机变量为x，参数为a的概率密度函数p(x;a)。对于在集合A中的每一个值a，p(x;a)是一个关于x的概率密度函数，给出概率密度函数w(要求w非负且积分为1),则函数：

f(x)就是一个关于x的概率密度函数。

Gamma函数

了解Gamma函数的性质和一些有用的计算公式，在后面复杂的分布中会用到这些公式和表示方式。

学生t-分布及其混合分布

学生t-分布(Student‘s t-distribution)

在概率论和统计学中，学生t-分布（Student‘s t-distribution），可简称为t分布。应用在估计呈正态分布的母群体之平均数。它是对两个样本均值差异进行显著性测试的学生t检定的基础。

其中，ν被称作自由度(degrees of freedom)，当ν=1时，该分布退化为柯西分布(Cauchy Distribution)；当ν→∞时，该分布为高斯分布。

Scale Mixture of Normals

Student T分布可以看做是正态分布和Gamma分布的混合体，由于是连续分布，所以该混合体表示为积分形式。其公式推导如下，在求解积分时用到了之前Gamma函数中列举的有用的积分公式：

Laplace分布及其混合分布

laplace分布

在概率论与统计学中，拉普拉斯分布是以皮埃尔-西蒙·拉普拉斯的名字命名的一种连续概率分布。由于它可以看作是两个不同位置的指数分布背靠背拼接在一起，所以它也叫作双指数分布。两个相互独立同概率分布指数随机变量之间的差别是按照指数分布的随机时间布朗运动，所以它遵循拉普拉斯分布。

如果随机变量的概率密度函数分布为：

那么它就是拉普拉斯分布。其中，μ是位置参数，b>0是尺度参数。

Gaussian-Exponential Mixture

laplace分布可以看成是高斯分布和指数分布的混合体。

负二项分布及其混合分布

负二项分布(Negative Biomial Distribution)

负二项分布是统计学上一种离散概率分布。“负二项分布”与“二项分布”的区别在于：“二项分布”是固定试验总次数N的独立试验中，成功次数k的分布；而“负二项分布”是所有到成功r次时即终止的独立试验中，失败次数k的分布。

其概率质量函数为：

Gamma-Poisson Mixture

Negative Biomial分布可以看做是Gamma分布和泊松分布的混合体。

混合分布的意义

这里我们列举了三种常见分布及其混合分布，这种混合分布的表示形式的意义在于，复杂分布的期望和方差等数字特征不好求解，但可以将其表示为更加简单的分布的混合形式，我们知道高斯分布、泊松分布等分布的数字特征可以由其参数得到，这样的话，就可以很容易的通过简单的分布得到复杂分布的一些数字特征。

参考资料

Wiki:Mixture Distribution

LDA-math-神奇的Gamma函数

神奇的伽玛函数(上)

神奇的伽玛函数(下)

转载请注明作者Jason Ding及其出处

Github博客主页(http://jasonding1354.github.io/)

CSDN博客(http://blog.csdn.net/jasonding1354)

简书主页(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)

时间： 2024-08-29 16:49:44

【机器学习中的数学】比例混合分布的相关文章

机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用

机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系[email protected] 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的.在上篇文章中便是基于特征值分解的一种解释.特征值和奇异值在大部分人的印象中,往往是停留在纯粹的数学计

机器学习中的数学(4)-线性判别分析（LDA）, 主成分分析(PCA)

机器学习中的数学(4)-线性判别分析(LDA), 主成分分析(PCA) 版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系[email protected] 前言: 第二篇的文章中谈到,和部门老大一宁出去outing的时候,他给了我相当多的机器学习的建议,里面涉及到很多的算法的意义.学习方法等等.一宁上次给我提到,如果学习分类算法,最好从线性的入手,线性分类器最简单的就是

机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)

机器学习中的数学(1)-回归(regression).梯度下降(gradient descent) 版权声明: 本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com.如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任. 前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公开课,在

机器学习中的数学(2)-线性回归，偏差、方差权衡

机器学习中的数学(2)-线性回归,偏差.方差权衡版权声明: 本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com.如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任.如果有问题,请联系作者 [email protected] 前言: 距离上次发文章,也快有半个月的时间了,这半个月的时间里又在学习机器学习的道路上摸索着前进,积累了一点心得,以后会慢慢的写写这些心得.写文章是促进自己对知识认识的一个好方法,看书的时候往往不是非

机器学习中的数学-回归(regression)、梯度下降(gradient descent)<1>

机器学习中的数学(1)-回归(regression).梯度下降(gradient descent) 版权声明: 本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com.如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任. 前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公开课,在

（转）机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)

版权声明: 本文由LeftNotEasy所有,发布于http://leftnoteasy.cnblogs.com.如果转载,请注明出处,在未经作者同意下将本文用于商业用途,将追究其法律责任. 前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公开课,在verycd可下载,可惜没有翻译.不过还是可以看.另外一个是prml-pattern recogni

（转）机器学习中的数学(5)-强大的矩阵奇异值分解(SVD)及其应用

版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系[email protected] 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的.在上篇文章中便是基于特征值分解的一种解释.特征值和奇异值在大部分人的印象中,往往是停留在纯粹的数学计算中.而且线性代数或者矩阵论里面,也很少讲任何跟特征值与奇异值有

【机器学习中的数学】贝叶斯概念学习

概念学习许多机器学习问题涉及从特殊训练样例中得到一般概念.比如人们不断学习的一些一般概念和类别.每个概念可被看作一个对象或事件集合,它是从更大的集合中选取的子集(如从动物的集合中选取鸟类),或者是在这个较大集合中定义的布尔函数(如在动物集合中定义的函数,它对鸟类返回true,对其他动物返回false). 小孩理解一个词义的例子考虑一个小孩子理解"狗"这个词的意义.假设当小孩的父母指着一个动物对他说,"这是一只狗",这是给出了概念的正例.而当小孩子看到一只猫时说,

机器学习中的数学-强大的矩阵奇异值分解(SVD)及其应用《5》

版权声明: 本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com, 本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系[email protected] 前言: 上一次写了关于PCA与LDA的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的.在上篇文章中便是基于特征值分解的一种解释.特征值和奇异值在大部分人的印象中,往往是停留在纯粹的数学计算中.而且线性代数或者矩阵论里面,也很少讲任何跟特征值与奇异值有

猜你喜欢

ViewGroup源码解读

我们之前刚刚分析完事件传递机制和view的源码,如果没有看过的,建议看完View的事件拦截机制浅析以及View的事件源码解析.这次我们来分析下viewgroup的. 可能有人会想,怎么又是源码分析,肯 ...

office2016 软件全集官方下载免费完整版(含破解文件)不含垃圾软件 win10完美激活

office2016官方下载免费完整版是新一代办公软件,office2016官方下载免费完整版已经分享到下面,office2016官方下载免费完整版包括了Word.Excel.PowerPoint.O ...

openCV2马拉松第18圈——坐标变换

计算机视觉讨论群162501053 转载请注明:http://blog.csdn.net/abcd1992719g 收入囊中仿射变换坐标映射利用坐标映射做一些效果,例如以下 watermark/ ...

ssh 链接服务器出现 Write failed: Broken pipe

方法来源 Ssh “Write failed: Broken pipe” - NewInstance I started to get this error “Write failed: Broken ...

一分钟理清Vue-cli 代码构建步骤

1. $ npm install vue -cli -g $ vue init webpack project-name $ cd project-name $ npm install$ npm ru ...

JSONObject.fromObject

JSONObject.fromObjectjava.lang.ClassNotFoundException: org.apache.commons.lang.exception.NestableRun ...

RestServer 1.1发布

具体配置方法参照第一版:http://www.cnblogs.com/devgis/p/4947191.html BUG反馈 QQ:80163278 邮箱:[email protected] 淘宝:h ...

T-SQL概述

T-SQL是标准的SQL程序设计语言的增强版,是用以程序与SQL Server沟通的主要语言. 每条SQL语句均由一个谓词(Verb)开始,如 SELECT 或 UPDATE 关键词.谓词后紧接着一个 ...

Java之JDK的安装与环境配置

Part I :JDK的安装 JDK(Java Development Kit) 是 Java 语言的软件开发工具包(SDK). 是运行及开发Java软件必不可少的运行环境. 只要百度"JD ...

Cisco实验分享

Cisco实验分享 --百家菜实验1 rip协议实验2 单臂路由实验3 直连路由实验4 静态路由实验5 静态路由拓展实验6 综合实验

GO语言总结(1)——基本知识

1.注释(与C++一样) 行注释:// 块注释:/* ... */ 2.标识符可以这么说,除了数字开头的不允许,符号开头的不允许,关键字不允许,其他的Unicode字符组合都可以.“_33”也可以是 ...

【BZOJ1018】[SHOI2008]堵塞的交通traffic 线段树

[BZOJ1018][SHOI2008]堵塞的交通traffic Description 有一天,由于某种穿越现象作用,你来到了传说中的小人国.小人国的布局非常奇特,整个国家的交通系统可以被看成是一个 ...

20150108-笑笑和明明

这几天看到好些东西,接收一些东西, 东西多了有些乱,整理是必不可少的,其它就那.但是看到的就拿下来罢. 时间会解决一切麻烦. 笑笑说笑着过着今天就好了, 明明说明天还有明天的欢乐.

关于浏览器cookie的那些事儿

昨天接到一个小需求,就是在ipad上访问某页面,页面顶部出现一个下载客户端的提示,点击关闭按钮后,提示信息消失,信息存入cookie,在cookie未过期之前,除非用户自己清除浏览器的cookie,否 ...

商务沟通方法与技巧

沟通注意事项:1.在沟通过程要做到及时准确2.沟通过程中信息的变化要做到及时跟进,确认,以免发生错误. 沟通中的物理障碍:干扰,距离,不良的设备,员工短缺,不良的工作环境. 谈判技巧:沉默:在不知道对 ...

iOS开发中CATransition过渡动画的类型

移动开发过程中, 动画是必不可少的,有了动画,仿佛我们的程序有了生命一样.动画可以让我们的程序界面变化更流畅, 而不是很突兀的感觉.今天,就说一下CATransition过渡动画. 我们先看一下过渡动 ...

Java单例模式——并非看起来那么简单

版权声明:本文为[viclee]原创,如需转载请注明出处~ Java中单例(Singleton)模式是一种广泛使用的设计模式.单例模式的主要作用是保证在Java程序中,某个类只有一个实例存在.一些管理 ...

MySQL一些常用的时间函数 current_timestamp()

mysql自带的一些函数功能也是很强大的,这里整理了一下时间方面的 //获取当前时间戳 current_timestamp() yyyy-mm-dd hh:ii:ss curdate() yyyy-m ...

Node.js开发 ---- Robomongo连接服务器

1.下载Robomongo-0.9.0-rc9-windows-x86_64-0bb5668.exe 2.启动MongoDB 打开mongo.exe 3.启动Robomongo.exe连接 .

squid常用调试命令

解压,编译,make ,make install 就不说了.从 make install 后开始.当你的 squid.conf 配置文档按照你的想法修改完以后,启动 squid 之旅就开始了.1,初始 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.