D-Separation(D分离)-PRML-8.22-Graphical Model 五 18 by 小军

D-Separation(D分离)-PRML-8.22-Graphical Model

五18by 小军

一、引言


在贝叶斯网络的学习过程中,经常会遇到(D-Separation)D-分离这个概念,D-分离是寻找网络节点之间的条件独立性的一种方法或者说一种问题的简化处理的技巧。采用D-分离技术,在用贝叶斯网络进行预测,诊断推理等方面,可以提高计算速度,减少计算复杂性。

D-Separation是一种用来判断变量是否条件独立的图形化方法。相比于非图形化方法,D-Separation更加直观,且计算简单。对于一个DAG(有向无环图)E,D-Separation方法可以快速的判断出两个节点之间是否是条件独立的。

二、三种情况分析

首先可以看看以下三种简单情况下条件独立的情况(对应于PRML中8.2.1的Three example
graphs
):

Example One:tail-to-tail (节点C连接的是两个箭头的尾部,如图)

可知, P(a,b,c)=P(a|c)*P(b|c)*P(c)    (1)

现在我们求 P(a,b),如果 P(a,b)=P(a)*P(b),则a和b是在c条件下独立分布的。分两种情况进行讨论:

(1)C值不作为观察点。令(1)式对c求积分,消去c值,考虑c是离散的情况,可得

可以看到,与 P(a,b)=P(a)*P(b)不等,所以a和b不是c条件独立的。

(2)C值作为观察点(即以C作为条件)。则可以知道C取某个c状态的概率为 P( c ),c 条件下 a 和 b发生的概率为

P( a,b|c )。 由下式:

可得a 和 b 是 c 条件下独立的。

Example Two:head-to-tail

可知,p(a,b,c)=p(a)*p(c|a)*p(b|c)   (2)

同样分两种情况进行讨论:

(1)、c值不作为观察点。对(2)式(考虑c是离散的情况)积分可得:

可知,a和b不是c条件独立的。

(2)、c值作为观察点。则图模型表示为:

c 条件下 a 和 b发生的概率为 P( a,b|c )。
由下式:

可知,a 和 b 是 c 条件下独立的。

Example Three:head-to-head

可知 p(a,b,c)=p(a)*p(b)*p(c|a,b)    (3)

同理,分两种情况讨论:

(1)、c值不作为观察点。由于所有p(c|a,b)相加和=1,所以有(3)式消去c,可得 p(a,b)=p(a)*p(b),即a与b是条件独立的。

(2)、c值作为观察点。

所以有:

最后不能因式分解成p(a)*p(b)的形式,所以a与b不是c条件独立的。

三、总结

对于较为复杂的 DAG 图,我们可以给出一个普遍意义上的结论 ,也就是 D-Seperation。 对于 DAG 图 E,如果A,B,C是三个集合(可以是单独的节点或者是节点的集合),为了判断 A 和 B 是否是 C 条件独立的, 我们考虑 E 中所有 A 和 B 之间的 无向路径 。对于其中的一条路径,如果她满足以下两个条件中的任意一条,则称这条路径是 阻塞(block) 的:

(a)路径中存在某个节点 X 是 head-to-tial 或者 tail-to-tail 节点(Example
one/two),并且 X 是包含在 C 中的;

(b)路径中存在某个节点 X 是 head-to-head 节点(Example
Three),并且 X 或 X 的儿子都不是包含在 C 中的;

如果 A,B 间所有的路径都是阻塞的,那么 A,B 就是关于 C 条件独立的;否则, A,B 不是关于 C 条件独立的。

四、应用例子

根据D-Seperation分隔定理,我们可以很容易的判断是否是条件独立的。我们来看一个例子:

判断图中a与b是否在c条件下独立a与b是否在f条件下独立

图中可以看到 a 到 b 只有一条路径 a->e->f->b 。 考虑路径上的点 e 和 f :其中e 是 head-to-head 类型的,且 e 的儿子节点就是 c ,根据(b),e没有被阻断,而节点f是tail-to-tail类型节点,根据(a),f不在c中,所以 a 和 b
不是 c 条件下独立的。

现在如果要判断 a 和 b 是否是 f 下条件独立的。同样的方法,考虑路径 a->e->f->b 上的所有节点。节点 e 是head-to-head 类型的,e 和她的儿子节点 c 都不在 f 中,根据(b)可知,所以e是阻断路径的节点。节点 f 是tail-to-tail 节点,且 f 节点就在 f 中,根据(a),可知 f 节点阻断了路径。 结论:a 和 b是 f 下条件独立的。

D-Seperation 还可以用来证明独立同分布马尔科夫边界等。

五、参考资料

1、http://www.andrew.cmu.edu/user/scheines/tutor/d-sep.html#d-sepapplet2

2、http://blog.sina.com.cn/s/blog_7a24649f0101hjdx.html 
(-->!This is an error!)

3、《pattern recognition and meaching learning》-chapter
8:Graphical Model-8.2 conditional independence

    1.  

D-Separation(D分离)-PRML-8.22-Graphical Model 五 18 by 小军,布布扣,bubuko.com

时间: 2024-10-06 12:28:46

D-Separation(D分离)-PRML-8.22-Graphical Model 五 18 by 小军的相关文章

Num 22 : NYOJ : 0055 懒省事的小明 [ 优先队列 ]

生活中我们会遇到各种各样的队列的问题,在C语言中,也有几类关于队列的问题: 普通队列.链队列.循环队列.优先队列( 算法中应用最为广泛,常出现在BFS中 ); 今天就在这里总结一下有关优先队列的一些用法:     优先队列: 对于一般的队列,遵循的是简单地FIFO( first input first output )[ 先进先出 ]的原则: 这一点与栈的特性正好相反: 对于优先队列,特点不是先进先出,而是满足一定条件的元素先出队( 例如,每次都是最大的元素出队 ). 一.声明方法: 优先队列的

2-2列表,浅copy,小程序购物车

#!/usr/bin/env python# -*- coding:utf-8 -*- #列表a=['aa','bb','cc','dd','ee']b=a.copy() #复制 ### b=a a变b变.print(a);print(b) #一样a[1]='ss';a.append('zz')print(a);print(b)#a变b不变#循环for i in b: print(i)#切片 步长2print(a[::2]) print('++++++++++++++++++')#浅copya=

mysql 开发基础系列22 SQL Model

一.概述 与其它数据库不同,mysql 可以运行不同的sql model 下, sql model 定义了mysql应用支持的sql语法,数据校验等,这样更容易在不同的环境中使用mysql. sql model 常用来解决下面几类问题 (1) 通过设置sql mode, 可以完成不同严格程度的数据校验,有效地保障数据准备性. (2) 通过设置sql model 为ansi 模式,来保证大多数sql符合标准的sql语法,这样应用在不同数据库之间进行迁移时,则不需要对业务sql 进行较大的修改. (

从壹开始前后端分离 [.netCore 不定期更新 ] 三十五║ 完美实现全局异常日志记录

缘起 哈喽我是不定期更新的日常,昨天群里小伙伴问到了记录日志,当然,以前我也挖过这个坑,后来一直没有来得及填上,也想着 swagger 一直又有错误信息展示的功能,就迟迟没有添加这个功能,不过昨天夜里想了想,还是需要增加上,旨在提高框架的高效性.不定期日常就直接上代码了,我有一个小想法,就是希望大家有好的想法,可以给我说,我会整理下,添加到框架里,并在文章头里写上 投稿作者:这里重点说明下,是参考群里小伙伴 Hello World! 的相关内容,并在他的基础上更新,添加了注入和全局,大家可以看看

概率图模型(PGM,Probabilistic Graphical Model)

PGM是现代信号处理(尤其是机器学习)的重要内容. PGM通过图的方式,将多个随机变量之前的关系通过简洁的方式表现出来.因此PGM包括图论和概率论的相关内容. PGM理论研究并解决三个问题: 1)表示(如何通过图来刻画多个随机变量之间的关系)(注:这个是PGM的基础) 2)学习(如何通过已知数据来确定图的参数) (注:机器学习主要研究这个问题) 3)推断(如果根据已知图,来推断出想要的统计结论)  (注:消息传递主要研究这个问题) 表示(Representations) 原文地址:https:/

【大前端之前后分离】JS前端渲染VS服务器端渲染

前言 之前看了一篇文章:@Charlie.Zheng Web系统开发构架再思考-前后端的完全分离,文中论述了为何要前后分离,站在前端的角度来看,是很有必要的:但是如何说服团队使用前端渲染方案却是一个现实问题,因为如果我是一个服务器端,我便会觉得不是很有必要,为什么要前后分离,前后分离后遗留了什么问题,如何解决,都得说清楚,这样才能说服团队使用前端渲染的方案,而最近我刚好遇到了框架选型的抉择. 来到新公司开始新项目了,需要做前端框架选型,因为之前内部同事采用的fis框架,而这边又是使用的php,这

22本数据分析、挖掘的好书推荐

1. 深入浅出数据分析 这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分. 难易程度:非常易. 2.啤酒与尿布 通过案例来说事情,而且是最经典的例子. 难易程度:非常易. 3.数据之美 一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助. 难易程度:易. 4.集体智慧编程 学习数据分析.数据挖掘.机器学习人员应该仔细阅读的第一本书.作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂,还有可执行的Python代码. 难易

22本数据分析、挖掘的好书推荐——干货分享

1. 深入浅出数据分析 (豆瓣)这书挺简单的,基本的内容都涉及了,说得也比较清楚,最后谈到了R是大加分. 难易程度:非常易. 2. 啤酒与尿布 (豆瓣)通过案例来说事情,而且是最经典的例子. 难易程度:非常易. 3. 数据之美 (豆瓣)一本介绍性的书籍,每章都解决一个具体的问题,甚至还有代码,对理解数据分析的应用领域和做法非常有帮助. 难易程度:易. 4. 集体智慧编程 (豆瓣)学习数据分析.数据挖掘.机器学习人员应该仔细阅读的第一本书.作者通过实际例子介绍了机器学习和数据挖掘中的算法,浅显易懂

源码安装实现lamp的amp分离及Xcache加速

LAMP的搭建: 搭建LAMP的平台,要求apache.mariadb.php三个程序分别实现在三台虚拟机上,实现动静分离. 1.虚拟机IP 172.18.250.77,安装Apache实现和PHP的交互,httpd与php的交互有三种方式,cgi.fcgi和模块方式,因为是跨主机的交互,所以使用fcgi的方式实现 2.虚拟机IP 172.18.250.76,安装php和php-fpm,实现对动态页面的处理. 3.虚拟机IP 172.18.250.10,安装mariadb数据库,实现php对数据