《概率统计》基于马尔科夫链的近似采样

楔子

从这一篇开始,我们主要来介绍基于马尔科夫链的近似采样过程。具体如何采样,以及整个采样过程中的思维过程,我们随着这篇的内容讲解而逐步展开

马尔科夫链的稳态与采样的关系

马尔科夫链的平稳分布是一个意义非凡的重要特性,我们换个角度说明一下大家就能明白它的重要意义:也就是说无论我们的起始状态是位于状态 1、状态 2 还是状态 3,在状态转移矩阵 P 的作用下,经过足够大的 n 步转移之后,它处于三种状态的概率都是固定的

利用下面这幅图,我们可以把这个状态转移和到达稳态的过程表达得更加直白一些:

好比说我们有一颗小石头,在最开始的时候,它可以位于任意一个初始状态,这里为了方便画图,假设它处于状态 2。那么从初始状态开始,在状态转移矩阵中的转移概率的作用下,这颗小石头不停地在状态 1、状态 2 和状态 3 之间随机游走,图中的红色虚线示意了其中具体的某一条转移路径。

当然转移的路径可不止这一条,在状态转移的过程中,状态之间的转移概率等于该马尔科夫链的状态转移矩阵对应位置上的元素 \(P_{ij}\),那么经过足够多的 n 步转移之后,这个小石头将最终依概率落入到三个状态中的某一个当中,具体就是:落入到状态 1 的概率是 0.3888,落入到状态 2 的概率是 0.2777,落入到状态 3 的概率是 0.3333。

当然如果只有一个小石头,最终它还是只会落入到具体的某一个状态当中,但是如果小石头的数量足够多,那么这不就是一个大数定理的实际应用了吗,我们拿足够多的小石头,从任意的初始状态出发,最终落入到各个状态中的小石头的数量所占的比例就等于各个状态的平稳分布概率。

基于马尔科夫链进行采样的思路

背后的大数定理

那么,我们重新提炼一下这里面的核心思路。我们这里提到的马尔科夫链,它的状态转移矩阵

\(\begin{bmatrix}0.7&0.1&0.2\\0.3&0.5&0.2\\0.1&0.3&0.6\end{bmatrix}\)

对应的稳态分布是 [0.3888,0.2777,0.3333]。如果我们利用大的数据样本,从任意的初始状态出发,经过足够长的步数转移之后,我们去统计和计算落入到三个状态中的小石头各自所占的比例,就可以近似为平稳分布。

由此我们就实现了利用数值模拟的方法对这个目标平稳分布的采样,这就是基于马尔科夫链的采样方法的思维雏形

时间分布与空间分布的一致性

在基于马尔科夫链的采样过程中,我们如何来具体进行方法的实施呢?怎样来实现对大样本的模拟?

比如我们采样的样本数定为 100000 个,我们最简单粗暴的方法是对每一个样本都执行一次 n 步转移(这个 n 相对较大,要保证进入到马尔科夫链的稳态当中),但是这样一来计算量相当大,每次只利用了采样过程中的最后一个状态,且要运行 100000 次进入平稳状态的转移过程,数据的利用率很低,浪费也很大。

实际上在基于马尔科夫链的具体采样过程中,我们往往只需要进行一次转移过程,就能够实现了整个采样过程。

这里,我们依托的是之前讲过的稳态分布的基本定义,即对于一个马尔科夫链,如果它的状态转移矩阵是 P,稳态分布是 π,那么它们满足 π=\(P_{π}\) 的相等关系。

这里的意思就是说,我们只需要对一个小石头进行状态转移就可以实现采样的目标。即:在它进入到稳态的那一刻(我们记作时刻 \(t_{0}\))开始,它依照稳态分布中的概率进入到状态 1 、状态 2 或者状态 3 当中的任意一个,那么当小石头从 \(t_{0}\) 时刻的状态向下一个时刻(也就是 \(t_{1}\) 时刻)转移时,依照 \(π=P_{π}\) 的相等关系,这个小石头仍然是依照稳态的概率分布进入到状态 1、状态 2 或者状态 3 中的任意一个,那么此时在 \(t_{1}\) 时刻,小石头和之前经过千辛万苦在 \(t_{0}\) 时刻进入稳态时的状态本质上是一回事儿。

以此类推,对于后面的所有转移时刻:\(t_{2}、t_{3}......t_{n}\),小石头在每时每刻都依概率进入到三个状态中的一个,这个概率同样也是稳态分布的概率。

那么好,这么说来我们确实只用对一个小石头的一次转移过程进行跟踪就可以了。我们巧妙地用时间的平稳分布等价替代了空间的平稳分布,省时省力。我们具体定义和描述一下这里面涉及到的变量和过程。

具体实施过程

假如我们需要采样的样本数是 N 个,而进入到稳态所需要的转移次数是 m 次(我们把 m 次的转移过程称作是燃烧期),那么我们就记录这一个小球从 m 到 m+N 这 N 次转移的过程中(我们把进入稳态后的转移过程称作是平稳期)的每个时间点所处的状态,那么我们记录下的这 N 个状态就一定服从稳态分布中各个状态的概率。于是我们仅仅通过跟踪一次状态转移的过程,就能够对目标分布实现基于马尔科夫链的样本采样。

我们通过下面这幅图,来示意整个采样的全过程:

这幅图说得很明白了,我们只跟踪这一个小石头,当小石头经过 m 次转移的燃烧期进入到平稳期之后,每一次转移我们都记录下它所处的状态,我们的采样样本数是 N,那么我们就在平稳期内让小石头按照状态转移矩阵进行 N 次转移,从而得到 N 个采样结果,这 N 个采样结果的状态分布就和稳态分布一致。

原文地址:https://www.cnblogs.com/traditional/p/12612296.html

时间: 2024-10-09 03:25:58

《概率统计》基于马尔科夫链的近似采样的相关文章

基于马尔科夫链的产品评估预测

马尔可夫链 1.建立转移概率矩阵: 马尔可夫链是一种时间离散.状态离散.带有记忆功能情况的随机过程,是预测中常用到的一种数学模型.如果数据的本身的每一时刻的状态仅仅取决于紧接在他前面的随机变量的所处状态,而与这之前的状态无关,这就是马尔可夫链的“无后效性”. 经过了解本文的销量对于时间序列敏感性不高,具有“无后效性”的特点,因此可以根据唯品历史以来的销量进行其预测,可以得到下一次档期每个商品的销售状态. 为了准确的计算整个目标系统的转移概率矩阵是马尔可夫链预测方法最常用到也是最基础的内容,一般是

基于马尔科夫链的股市大盘指数预测

原文地址:https://www.cnblogs.com/fangbei/p/8409132.html

MCMC(二)马尔科夫链

MCMC(一)蒙特卡罗方法 MCMC(二)马尔科夫链 MCMC(三)M-H采样和Gibbs采样(待填坑) 在MCMC(一)蒙特卡罗方法中,我们讲到了如何用蒙特卡罗方法来随机模拟求解一些复杂的连续积分或者离散求和的方法,但是这个方法需要得到对应的概率分布的样本集,而想得到这样的样本集很困难.因此我们需要本篇讲到的马尔科夫链来帮忙. 1. 马尔科夫链概述 马尔科夫链定义本身比较简单,它假设某一时刻状态转移的概率只依赖于它的前一个状态.举个形象的比喻,假如每天的天气是一个状态的话,那个今天是不是晴天只

《概率统计》状态转移:初识马尔科夫链

回顾两类重要的随机过程 在上一篇随机过程的概述中,我们提到过两类非常非常典型且重要的随机过程,一类是:伯努利过程和泊松过程,这一类随机过程是无记忆性的,也就是说未来的状态不依赖于过去的状态--新的"成功"或"到达"不依赖于该过程过去的历史情况. 而另一类则正好相反,未来的情况会依赖于过去的情况,并且能够在某种程度上通过过去发生的情况去预测未来,例如这一篇我们的核心内容--马尔科夫过程,它在许许多多的领域都有深入和广泛的应用. 离散时间的马尔科夫链 马尔科夫链三要素

马尔科夫链蒙特卡洛采样(MCMC)入门

1.从随机变量分布中采样 研究人员提出的概率模型对于分析方法来说往往过于复杂.越来越多的研究人员依赖数学计算的方法处理复杂的概率模型,研究者通过使用计算的方法,摆脱一些分析技术所需要的不切实际的假设.(如,正态和独立) 大多数近似方法的关键是在于从分布中采样的能力,我们需要通过采样来预测特定的模型在某些情况下的行为,并为潜在的变量(参数)找到合适的值以及将模型应用到实验数据中,大多数采样方法都是将复杂的分布中抽样的问题转化到简单子问题的采样分布中. 本章,我们解释两种采样方法:逆变换方法(the

13张动图助你彻底看懂马尔科夫链、PCA和条件概率!

https://mp.weixin.qq.com/s/ll2EX_Vyl6HA4qX07NyJbA [ 导读 ] 马尔科夫链.主成分分析以及条件概率等概念,是计算机学生必学的知识点,然而理论的抽象性往往让学生很难深入地去体会和理解.而本文,将这些抽象的理论概念,用可视化的方式来解释,还可调节相应参数来改变结果,使这些抽象概念变得生动而立体! 计算机相关概念太难.太抽象?别怕,往下看! 人类对视觉信息的记忆要远远大于文字信息.使用图表等形式的可视化,可以让抽象.难懂的概念一目了然:在此基础之上,添

马尔科夫链 Markov Chains

Good resource, Markov Chains Explained Visually,  http://setosa.io/ev/markov-chains/ ============================ 马尔可夫链(Markov chain),又称离散时间马尔可夫链(discrete-time Markov chain),因俄国数学家安德烈·马尔可夫(俄语:Андрей Андреевич Марков)得名,为状态空间中经过从一个状态到另一个状态的转换的随机过程.该过程

马尔科夫链和隐马尔可夫模型(转载)

马尔可夫模型是由Andrei A. Markov于1913年提出的 ?? 设 SS是一个由有限个状态组成的集合 S={1,2,3,-,n?1,n}S={1,2,3,-,n?1,n} 随机序列 XX 在 tt时刻所处的状态为 qtqt,其中 qt∈Sqt∈S,若有: P(qt=j|qt?1=i,qt?2=k,?)=P(qt=j|qt?1=i)P(qt=j|qt?1=i,qt?2=k,?)=P(qt=j|qt?1=i) aij≥0∑jnaij=1aij≥0∑jnaij=1 则随机序列 XX构成一个一

Chapter 4 马尔科夫链

4.1 引言 现在要研究的是这样一种过程: 表示在时刻的值(或者状态),想对一串连续时刻的值,比如:,, ... 建立一个概率模型. 最简单的模型就是:假设都是独立的随机变量,但是通常这种假设都是没什么根据的,也缺乏研究的意义. 举例来说的话,如果用来代替某个公司,比如Google,在个交易日之后的股票价格. 那么说第天的股票价格和之前第天,第天,第乃至第天的股票价格一点关系都没有,这样是说不过去的. 但是说第天股票的收盘价格依赖于第天的收盘价格还是有点道理的. 同样还可以做出这样的合理假设:在