七月算法-12月机器学习在线班--第十四次课笔记—EM算法

七月算法（julyedu.com）12月机器学习在线班学习笔记http://www.julyedu.com

EM Expection Maxium 期望最大化

1 引例

1000人，统计身高，1.75，1.62,1.94，有多少男女，每个身高对应的男女

1.1 如何算？利用极大似然估计，估算均值和方差

上述结论和矩估计的结果是一致的，

即：样本的均值即高斯分布的均值，样本的伪方差即高斯分布的方差。

如果是高斯分布，就可以这么用本计算，均值和方差

设定，男女的身高服从两个高斯分布

随机变量X是有K个高斯分布混合而成，若观测到随机变量X的一系列样本x1,x2,...,xn，

则目标函数为：对数似然函数

由于在对数函数里面又有加和，没法直接用求导解方程的办法直接求得极大值。分成两步

1.2 直观上的理解EM

STEP1:
估算数据来自哪个组份

STEP2:
估计每个组份的参数

1.3 高斯式证明

有上图的图中可以得知：做期望的极大，不停的做期望的极大

利用Jensen不等式（凸优化可以直接用）

令Qi是z的某一个分布，Qi≥0，有：

进一步分析：有上面的等式成立可以得知，p,q成正比;

则可以得到EM的整体框架图

1.4 从理论公式推导GMM

随机变量X是有K个高斯分布混合而成取各个高斯分布的概率为φ1φ2... φK，第i个高斯分布的均值为μi，方差为Σi。若观测到随机变量X的一系列样本x1,x2,...,xn，试估计参数π，μ，Σ。

分别是E-STEP,和M-step

E-STEP:

M-step：（先写出期望，在求极大值）

对均值求偏导，令上式等于0，解的均值：

同理，可以得到方差的值。

在得到方差和均值后，对φ求偏导，约束条件是φ1+φ2+... φK=1，也就是带等式的约束条件求极值，拉格朗日乘子法

最终得到的式子和，最原先开始欧拉式的解释一样

对于所有的数据点，可以看作组份k生成了这些点。组份k是一个标准的高斯分布

带有隐变量的方法：EM+变分

时间： 2024-12-22 02:13:05

七月算法-12月机器学习在线班--第十四次课笔记—EM算法的相关文章

七月算法-12月机器学习在线班--第十八次课笔记-条件随机场CRF

七月算法-12月机器学习在线班--第十八次课笔记-条件随机场CRF 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 1,对数线性模型一个事件的几率odds,是指该事件发生的概率与该事件不发生的概率的比值. 1.1对数线性模型的一般形式令x为某样本,y是x的可能标记,将Logistic/ Softmax回归的特征记做特征函数的选择:eg: 自然语言处理 1, 特征函数几乎可任意选择,甚至特征函数间重叠: 2, 每个特征之和当前的词

七月算法--12月机器学习在线班-第十九次课笔记-深度学习--CNN

七月算法--12月机器学习在线班-第十九次课笔记-深度学习--CNN 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 1,卷积神经网络-CNN 基础知识三个要点 1: 首先将输入数据看成三维的张量(Tensor) 2: 引入Convolution(卷积)操作,单元变成卷积核,部分连接共享权重 3:引入Pooling(采样)操作,降低输入张量的平面尺寸 ,1.1 张量(Tensor) 高,宽度,深度,eg:彩色图像:rgb,3个深度,图

七月算法--12月机器学习在线班-第十二次课笔记—支持向量机（SVM）

七月算法-12月机器学习在线班--第十二次课笔记-支持向量机(SVM) 七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com ? 复习的内容: 对偶问题 KKT条件 ? SVM 1.1三类数据类型线性可分支持向量机线性支持向量机非线性支持向量机 ? 1.2 线性分类 1.2.1 样本到分类面的距离的意义点到直线的距离,ABC是归一化的."+"正类别,"-"负类别因此距离可以直接用AX+BY+c=f(x,

七月算法-12月机器学习在线班--第十六次课笔记—采样和变分

七月算法-12月机器学习--第十六次课笔记—采样和变分七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 第一部分采样引言为什么要研究采样? 根据采样结果估算分布的参数,完成参数学习. 前提:模型已经存在,但参数未知: 方法:通过采样的方式,获得一定数量的样本,从而学习该系统的参数. 1 采样算法现需要对概率密度函数f(x)的参数进行估计,若已知的某概率密度函数g(x)容易采样获得其样本,可以如何估计f(x)的参数? g(x)很容

七月算法-12月机器学习在线班--第十五次课笔记—主题模型

七月算法-12月机器学习--第十五次课笔记—主题模型七月算法(julyedu.com)12月机器学习在线班学习笔记http://www.julyedu.com 复习的知识: 1.,Γ函数是阶乘在实数上的推广,即实数的阶乘 2,Beta分布 Beta分布的概率密度: 其中系数B为: 两者的关系 1,朴素贝叶斯分析朴素贝叶斯没有分析语意,无法解决语料中一词多义和多词一义的问题,更像是词法的分析,可以一, 1个词可能被映射到多个主题中——一词多义二,多个词可能被映射到某个主题的概率很高——多

七月算法--12月机器学习在线班-第三次课笔记—矩阵和线性代数

七月算法--12月机器学习在线班-第三次课笔记—矩阵和线性代数七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com

七月算法--12月机器学习在线班-第五次课笔记—回归

七月算法--12月机器学习在线班-第五次课笔记—回归七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com

七月算法--12月机器学习在线班-第一次课笔记—微积分与概率论

七月算法--12月机器学习在线班-第一次课笔记—微积分与概率论七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com

七月算法--12月机器学习在线班-第六次课笔记—梯度下降和拟牛顿

七月算法--12月机器学习在线班-第六次课笔记—梯度下降和拟牛顿七月算法(julyedu.com)12月机器学习在线班学习笔记 http://www.julyedu.com