EM算法理解

最近一直研究和看EM算法，尝试理解它的含义和用途，一直被人们称为“上帝的算法”，现在我就谈一下几点自己的看法。

它主要运用的场景应该是含有隐变量的地方，其中一个典型的情况就是混合高斯模型。用通俗的话来说，当一个模型很难描述数据的分布的情况时，需要多个模型的时候，便会引入隐变量的概念。一般问题，假设一堆观测数据属于两个集合，但是我们事先不知道每个观测点来自哪个集合，知识后还要我们求出这两个分布的模型参数。

假设知道属于哪一类求模型的参数，那么就是极大似然估计可以解决；假如知道高斯模型参数求属于哪一类，那么用贝叶斯公式就可以解决；但是既不知道属于哪一类也不知道模型参数，让我们同时优化，这个时候就出现了EM算法。具体的公式在这里就不介绍了，首先分为E步，通过假设属于哪一类（后续也需要不断迭代）；M步，假设已经知道属于哪一类了，就可以用极大似然估计求出模型参数，然后不断迭代直至最后收敛。

时间： 2025-01-02 14:01:39

EM算法理解的相关文章

EM算法学习笔记2：深入理解

文章<EM算法学习笔记1:简介>中介绍了EM算法的主要思路和流程,我们知道EM算法通过迭代的方法,最后得到最大似然问题的一个局部最优解.本文介绍标准EM算法背后的原理. 我们有样本集X,隐变量Z,模型参数θ,注意他们3个都是向量,要求解的log似然函数是lnp(X|θ),而这个log似然函数难以求解,我们假设隐变量Z已知,发现lnp(X,Z|θ) 的最大似然容易求解. 有一天,人们发现引入任意一个关于隐变量的分布q(Z),对于这个log似然函数,存在这样一个分解: lnp(X|θ)=L(q,θ

简单理解EM算法Expectation Maximization

1.EM算法概念 EM 算法,全称 Expectation Maximization Algorithm.期望最大算法是一种迭代算法,用于含有隐变量(Hidden Variable)的概率参数模型的最大似然估计或极大后验概率估计. 1.1 问题描述我们假设学校男生和女生分别服从两种不同的正态分布,即男生 ,女生 ,(注意:EM算法和极大似然估计的前提是一样的,都要假设数据总体的分布,如果不知道数据分布,是无法使用EM算法的).那么该怎样评估学生的身高分布呢? 简单啊,我们可以随便抽 100

EM算法（1）：K-means 算法

目录 EM算法(1):K-means 算法 EM算法(2):GMM训练算法 EM算法(3):EM算法详解 EM算法(1) : K-means算法 1. 简介 K-means算法是一类无监督的聚类算法,目的是将没有标签的数据分成若干个类,每一个类都是由相似的数据组成.这个类的个数一般是认为给定的. 2. 原理假设给定一个数据集$\mathbf{X} = \{\mathbf{x}_1, \mathbf{x}_2,...,\mathbf{x}_N \}$, 和类的个数K.我们的每个类都用一个中心点$

从最大似然到EM算法浅解

原文在这里机器学习十大算法之一:EM算法.能评得上十大之一,让人听起来觉得挺NB的.什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题.神为什么是神,因为神能做很多人做不了的事.那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引了那么多世人的目光. 我希望自己能通俗地把它理解或者说明白,但是,EM这个问题感觉真的不太好用通俗的语言去说明白,因为它很简单,又很复杂.简单在于它的思想,简单在于其仅包含了两个步骤就能完成强大的功能,复杂在于它的数学

机器学习中的EM算法详解及R语言实例（1）

最大期望算法(EM) K均值算法非常简单(可参见之前发布的博文),详细读者都可以轻松地理解它.但下面将要介绍的EM算法就要困难许多了,它与极大似然估计密切相关. 1 算法原理不妨从一个例子开始我们的讨论,假设现在有100个人的身高数据,而且这100条数据是随机抽取的.一个常识性的看法是,男性身高满足一定的分布(例如正态分布),女性身高也满足一定的分布,但这两个分布的参数不同.我们现在不仅不知道男女身高分布的参数,甚至不知道这100条数据哪些是来自男性,哪些是来自女性.这正符合聚类问题的假设,除

高斯混合模型与EM算法

对于高斯混合模型是干什么的呢?它解决什么样的问题呢?它常用在非监督学习中,意思就是我们的训练样本集合只有数据,没有标签. 它用来解决这样的问题:我们有一堆的训练样本,这些样本可以一共分为K类,用z(i)表示.,但是具体样本属于哪类我们并不知道,现在我们需要建立一个模型来描述这个训练样本的分布.这时, 我们就可以用高斯混合模型来进行描述. 怎么入手呢? 高斯混合模型: 我们这么想,因为样本集合潜在地是可以分为K类的,用z(i)表示第 i 样本所属的类别,所以z(i) 的范围为从1至 K.对于我们可

EM算法概念

EM算法是一种非常经典的alternative optimizing算法.alternative optimizing的思想就是对于一个最优化问题,可以计算分为两步或者参数分为两个,就可以随机任意的选择一个起始值或位置,固定一个参数A,以另一个参数B进行优化,然后固定参数B,以参数A进行优化,直到收敛未知.前面博文中所讲述的K-means也就这样的一个过程,或者meanshift均值漂移也是这样的一个思想.今天学习的一个算法也是这样一个概念.这里依然做一个入门级的概念理解指导,不做原理性的深入,

【机器学习】EM算法详细推导和讲解

[机器学习]EM算法详细推导和讲解今天不太想学习,炒个冷饭,讲讲机器学习十大算法里有名的EM算法,文章里面有些个人理解,如有错漏,还请读者不吝赐教. 众所周知,极大似然估计是一种应用很广泛的参数估计方法.例如我手头有一些东北人的身高的数据,又知道身高的概率模型是高斯分布,那么利用极大化似然函数的方法可以估计出高斯分布的两个参数,均值和方差.这个方法基本上所有概率课本上都会讲,我这就不多说了,不清楚的请百度. 然而现在我面临的是这种情况,我手上的数据是四川人和东北人的身高合集,然而对于其中具体的

GMM学习笔记（EM算法求解）

提出混合模型主要是为了能更好地近似一些较复杂的样本分布,通过不断增加component个数,可以任意地逼近任何连续的概率分布,所以我们认为任何样本分布都可以用混合模型来建模.因为高斯函数具有一些很实用的性质,所以高斯混合模型被广泛地使用. GMM与kmeans类似,也是属于clustering,不同的是,kmeans是把每个样本点聚到其中一个cluster,而GMM是给出这些样本点到每个cluster的概率,每个component就是一个聚类中心. GMM(Gaussian Mixture Mo

猜你喜欢

github分页插件的业务逻辑

github分页插件查询的业务逻辑: controller层: query封装前端传来的数据 Service层: 1.构建一个PageBounds:当前页(page).查询多少条(pageSize). ...

IOS6-UICollectionViewController

CollectViewController.h @interface CollectViewController : UIViewController<UICollectionViewDataS ...

linux常用快捷键

1 tab 命令补全或者目录路径补全 2 control+c 终止当前任务或者程序 3 control+d 退出当前用户环境相当于exit lo ...

myibatis的坑--text类型的字段查询缺失

问题:某个字段的类型为text(或者mediumtext,longtext)的时候,用selectByQuery语句查询出来的结果不包含该字段内容. myibatis 用mybatis-generat ...

优化LibreOffice如此简单

导读对于开源软件的支持者和粉丝来说,LibreOffice 无疑是 Microsoft Office 的最佳替代品,而且它已在过去的许多版本迭代中迎来了许多巨大改进.然而,通过用户的手动配置,我们还 ...

设置 LOCK_ESCALATION （Lock升级）选项

如果对分区表配置锁升级选项设置为Auto(设置 Lock_Escalation 为 auto),那么对表加锁的最大粒度是Partition,这样能在一定程度上提高表的并发度,提高更新速度,甚至防止发生 ...

哪有卖蒙汗葯

哪有卖蒙汗葯[订货:186-02559101 联系QQ201558724 林先生]一直秉承以用户需求为核心,提供高效货品.我们做的是长期生意,靠的是老客户长期支持.销售的各种药品药效保证,诚信交易 , ...

第二十章内存等空间管理类的实现

第二十章内存等空间管理类的实现空间.时间对我来说,或许永远是一个迷.即使我曾经深入到原子的最深处,即使人类科学家是自欺欺人,即使我了解到的最深层 ...

Yii的缓存机制之页面缓存

页面缓存是不能通过片段缓存来实现的,因为布局和内容不能同时缓存.只能通过过滤器来生成缓存. 实现方法: 在控制器里使用过滤器来实现 function filters (){ return array( ...

FreeMarker 使用实例

以下内容全部是网上收集: FreeMarker的模板文件并不比HTML页面复杂多少,FreeMarker模板文件主要由如下4个部分组成: 1,文本:直接输出的部分 2,注释:<#-- ... - ...

简易聊天客户端程序

import java.io.*; import javax.swing.*; import java.net.*; import java.awt.*; import java.awt.event. ...

挂号收费问题汇总

1.[问题] 挂号处挂号的操作的时候,没选择政府资助记账码,医生开完药,已经收现金,患者发现有问题,需要退钱. [解决]挂号处把原来挂的号的记账码选上,医生DC原来的医嘱重新开,收费处收费 [注意]如 ...

访问修饰符和继承

访问修饰符: 访问修饰符是对于跨类访问的一个权限限制 public : 公共的,引用命名空间即可随意访问,最高访问权限.private : 私有的,只有在声明它的类和结构中才可以访问,访问权限最低. ...

可将Loading指示器相对于容器绝对居中的jQuery插件

Center-Loader是一款可以将Loading指示器相对于容器绝对居中的jQuery插件.该插件可以使用图片或font-awesome字体图标来作为Loading指示器,并且可以将指示器相对于某 ...

新手开车必须知道的五十个小知识

万事开头难,开车当然也不例外.相信每一位驾驶员都经历过初次上路的忐忑不安,眼盯前方,双手紧握转向盘,身体僵直前倾,远离前车,缓慢前行,起步停车或遇到坡路和堵车时经常熄火等等,这些都是新手的写照,只要稍 ...

用protractor测试canvas绘制(一)

protractor是angular那帮人搞得一个e2e的测试框架,本质上是用的webdriver. 测试canvas,主要就是图像的比较,搜了搜,没有找到太好的nodejs库,所有还是用之前用过的r ...

菜鸟学习 - Unity中的热更新 - 更新思路

我们游戏对资源的更新并没有使用AssetBundle. 而是采用了下面的解决方案(客户端C# 和服务器 Java的约定 ,传输协议都是json): 第一步:客户端与服务器约定一个版本号.第二步:客户端 ...

读书笔记9秒杀系统设计

网购秒杀系统架构设计案例分析秒杀系统的技术挑战: 对现有网站业务造成冲击高并发下应用和数据库的负载突然增加的网络及服务器带宽直接下单(未到秒杀时间直接下单) ? 应对策略: 将秒杀系统于现有业 ...

Jsonp实现跨域请求Ajax

客户端 #!/usr/bin/env python import tornado.ioloop import tornado.web class MainHandler(tornado.web.Req ...

ListView_exc

listView布局: <RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android" ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.