隐马尔可夫模型（HMM）总结

摘要：

　　1.算法概述

　　2.算法推导

　　3.算法特性及优缺点

　　4.注意事项(算法过程，调参等注意事项)

　　5.实现和具体例子

　　6.适用场合

内容：

1.算法概述

　　隐马尔科夫模型（Hidden Markov Model）是关于时序的概率模型，描述由一个隐含的马尔科夫链生成不可观测的状态序列，再由状态序列生成观测序列的过程。这种通过观测序列预测隐含的标记序列的问题叫做标注。

下图来自维基百科：

并且本文有如下符号表示：

其中就是我们需要求得的一个三元组；拿中文分词的例子来说，分词中的状态序列是{ Begin,Middle,End,Single },对应单个字成词的就是Single,双连词就是{Begin,End},三联词就是{Begin,Middle,End}。而我们观测到的就是一个句子；通过HMM实现的分词算法可以通过

求得初始{ Begin,Middle,End,Single }这四个状态的分布，以及各个状态间相互转移的条件概率矩阵，当前状态对应一个中文词（Unicode编码）的条件概率矩阵。另一个直观的例子来自《统计学习方法》，是给定4个盒子（4个状态），每个盒子有若干红，白小球，给定一个观测序列，求对应盒子的序列。

最后马尔科夫模型的两个基本假设：

　　1.齐次马尔科夫假设：马尔科夫链的当前状态之和其前一刻的状态有关，与其它状态无关；对应的概率语言是：