七月算法-12月机器学习在线班--第十四次课笔记—EM算法

七月算法-12月机器学习在线班--第十四次课笔记—EM算法

七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com

?

EM Expection Maxium 期望最大化

1 引例

1000人,统计身高,1.75,1.62,1.94,有多少男女,每个身高对应的男女

?

1.1 如何算?利用极大似然估计,估算均值和方差

上述结论和矩估计的结果是一致的,

即:样本的均值即高斯分布的均值,样本的伪方差即高斯分布的方差。

如果是高斯分布,就可以这么用本计算,均值和方差

?

设定,男女的身高服从两个高斯分布

随机变量X是有K个高斯分布混合而成,若观测到随机变量X的一系列样本x1,x2,...,xn,

则目标函数为:对数似然函数

由于在对数函数里面又有加和,没法直接用求导解方程的办法直接求得极大值。分成两步

?

1.2 直观上的理解EM

STEP1:
估算数据来自哪个组份

STEP2:
估计每个组份的参数


1.3 高斯式证明


有上图的图中可以得知:做期望的极大,不停的做期望的极大

?

利用Jensen不等式(凸优化可以直接用)

令Qi是z的某一个分布,Qi≥0,有:

进一步分析:有上面的等式成立可以得知,p,q成正比;

则可以得到EM的整体框架图

?

1.4 从理论公式推导GMM

随机变量X是有K个高斯分布混合而成取各个高斯分布的概率为φ1φ2... φK,第i个高斯分布的均值为μi,方差为Σi。若观测到随机变量X的一系列样本x1,x2,...,xn,试估计参数π,μ,Σ。

分别是E-STEP,和M-step

E-STEP:

M-step:(先写出期望,在求极大值)

对均值求偏导,令上式等于0,解的均值:

同理,可以得到方差的值。

在得到方差和均值后,对φ求偏导,约束条件是φ1+φ2+... φK=1,也就是带等式的约束条件求极值,拉格朗日乘子法

最终得到的式子和,最原先开始欧拉式的解释一样

对于所有的数据点,可以看作组份k生成了这些点。组份k是一个标准的高斯分布

带有隐变量的方法:EM+变分

?

时间: 2024-12-22 02:13:05

七月算法-12月机器学习在线班--第十四次课笔记—EM算法的相关文章

七月算法-12月机器学习在线班--第十八次课笔记-条件随机场CRF

七月算法-12月机器学习在线班--第十八次课笔记-条件随机场CRF 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 1,对数线性模型 一个事件的几率odds,是指该事件发生的概率与该事件不发生的概率的比值. 1.1对数线性模型的一般形式 令x为某样本,y是x的可能标记,将Logistic/ Softmax回归的特征 记做 特征函数的选择:eg: 自然语言处理 1, 特征函数几乎可任意选择,甚至特征函数间重叠: 2, 每个特征之和当前的词

七月算法--12月机器学习在线班-第十九次课笔记-深度学习--CNN

七月算法--12月机器学习在线班-第十九次课笔记-深度学习--CNN 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 1,卷积神经网络-CNN 基础知识 三个要点 1: 首先将输入数据看成三维的张量(Tensor) 2: 引入Convolution(卷积)操作,单元变成卷积核,部分连接共享权重 3:引入Pooling(采样)操作,降低输入张量的平面尺寸 ,1.1 张量(Tensor) 高,宽度,深度,eg:彩色图像:rgb,3个深度,图

七月算法--12月机器学习在线班-第十二次课笔记—支持向量机(SVM)

七月算法-12月机器学习在线班--第十二次课笔记-支持向量机(SVM) 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com ? 复习的内容: 对偶问题 KKT条件 ? SVM 1.1三类数据类型 线性可分支持向量机 线性支持向量机 非线性支持向量机 ? 1.2 线性分类 1.2.1 样本到分类面的距离的意义 点到直线的距离,ABC是归一化的."+"正类别,"-"负类别 因此距离可以直接用AX+BY+c=f(x,

七月算法-12月机器学习在线班--第十六次课笔记—采样和变分

七月算法-12月机器学习--第十六次课笔记—采样和变分 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 第一部分 采样 引言 为什么要研究采样? 根据采样结果估算分布的参数,完成参数学习. 前提:模型已经存在,但参数未知: 方法:通过采样的方式,获得一定数量的样本,从而学习该系统的参数. 1 采样算法 现需要对概率密度函数f(x)的参数进行估计,若已知的某概率密度函数g(x)容易采样获得其样本,可以如何估计f(x)的参数? g(x)很容

七月算法-12月机器学习在线班--第十五次课笔记—主题模型

七月算法-12月机器学习--第十五次课笔记—主题模型 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 复习的知识: 1.,Γ函数 是阶乘在实数上的推广,即实数的阶乘 2,Beta分布 Beta分布的概率密度: 其中系数B为: 两者的关系 1,朴素贝叶斯分析 朴素贝叶斯没有分析语意,无法解决语料中一词多义和多词一义的问题,更像是词法的分析,可以 一, 1个词可能被映射到多个主题中——一词多义 二,多个词可能被映射到某个主题的概率很高——多

七月算法--12月机器学习在线班-第三次课笔记—矩阵和线性代数

七月算法--12月机器学习在线班-第三次课笔记—矩阵和线性代数 七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com

七月算法--12月机器学习在线班-第五次课笔记—回归

七月算法--12月机器学习在线班-第五次课笔记—回归 七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com

七月算法--12月机器学习在线班-第一次课笔记—微积分与概率论

七月算法--12月机器学习在线班-第一次课笔记—微积分与概率论 七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com

七月算法--12月机器学习在线班-第六次课笔记—梯度下降和拟牛顿

七月算法--12月机器学习在线班-第六次课笔记—梯度下降和拟牛顿 七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com