[PGM] I-map和D-separation

之前在概率图模型对概率图模型做了简要的介绍。此处介绍有向图模型中几个常常提到的概念,之前参考的多为英文资料,本文参考的是《概率图模型-原理与技术的》中译版本。很新的书,纸质很好,翻译没有很差。

1. 贝叶斯网络-不同视角

概率图模型,究其目的,在于描述多个(单个就没有意义了)变量概率分布之间的关系。有向图模型的描述方法是有指向性的,如果两变量之间有因果关系,这种描述方法就极为恰当。从这个角度上来说,考虑概率之间因子分解的过程,有向图模型是这一过程的一种表现方式。

而最初的考虑,即“变量概率分布之间的关系”,我们可以认为,有向图模型是条件独立性集合的表示。从简单的例子可以看出这一点,譬如有向图模型意味着。这是很好理解的,因为通过影响,如果作为已知条件,那么如何影响呢?可以通过因子分解过程验证这一过程

这也恰恰表明了,这两种不同的贝叶斯网络看待方式是等价的,对于这一点,书中总结为(“它”指贝叶斯网络)

  • 它是提供了以因子分解的方式紧凑表示联合分布骨架的数据结构;
  • 它是关于一个分布的一系列条件独立性假设的紧凑表示。

2. 独立性断言和I-map

记贝叶斯网络为,概率分布为的一个I-map是指中表现出的独立性的集合是中表现出的独立性的集合的子集。采用数学语言描述,给出以下定义。

是定义在上的形如的独立性断言的集合。令是独立性集合构成的贝叶斯网络,如果,那么的一个I-map。

根据定义,如果,那么是任意一个分布的I-map。当然这里描述的对象要是一样的。从这个角度考虑,如果贝叶斯网络的没两个节点之间有边连接,那么它是所有的I-map。显然,分布的I-map有多个,共同特点是图的限制比分布的少(子集关系),也就意味着这些图都可以表示这一分布。

注意:这里仅仅只定义了针对分布,上文中的也是一个分布,而不是图。

3. d-分离(D-separation)

上节给出了对应分布的独立性断言集合,同时我们还希望能够得到对应给定的图的独立性断言集合。首先仔细考虑图中节点之间的结构

  • :已知的情况下之间独立。
  • : 同上
  • :同上
  • :没有观测到及其后代下之间独立。(v-结构)

如果我们希望了解图上表示的条件独立特性,根据上述的四点,可以得出图上任意两节点之间的条件独立关系。对于上述的前三种情况,如果未知,那么就认为之间存在路径;对于第四种情况,如果或其后代已知,认为之间存在路径。对于任意两个节点,在给定已知节点集合后,如果存在相互影响的路径,记为存在有效的迹。了解了上面几点之后,给出以下定义。

如果是图中的三个节点集合,在给定下,如果任取中不存在有效的迹,那么记

以上就是d-分离的定义,同时记d-分离的集合为

这个集合也被称为全局马尔可夫独立性集。

4. 可靠性和完备性

上节定义的全局马尔可夫独立性集和分布的独立性集合的表现形式并没有区别。但是在最初的定义中就表现了中所有独立性断言的集合,这个所有意味着中不存在不属于(完备性),而中的每一独立性断言在中都是成立的(可靠性)。贝叶斯网络往往对应着分布,也希望从贝叶斯网络中观测出的d-分离特性有相同的特点,但是全局马尔可夫独立性集合的定义中并不能直接看出这两点,本节将探讨这一问题。

可靠性

据说后面(书4.5.1节)会有证明,但我还没看到那里。

完备性

我们自然希望d-分离可以检测出所有的独立性。可简单的理解为分布P中的任何独立性都体现在了图的d-分离性质中,但这是不成立的。分布可以表现出结构中没有显示的独立性。比如说网络的分布依旧可以为(对于这一点我还是不太明白,这难道不应该是I-map中所谓的可以有多个吗?)

  a0 a1
b0 0.4 0.6
b1 0.4 0.6

所以最后给出的完备性定义比较弱,即 对于几乎所有的G上的因子分集的P(除去参数化条件概率空间中测度为0的分布),我们有I(P)=I(G)。

5. 最小I-map和P-map

    最小I-map

前面讨论了那么多分布和图的相关知识,如果说将分布采用合适的图结构表现,那么很多独立性结构就一目了然了。从I-map来考虑,显然一个完全图的独立性断言是空集,是任何分布的I-map,但是这毫无意义。我们只关注能够体现分布的独立性关系的具有最少边的图,这就是最小I-map。

    注意:似乎只要G是分布P的一个最小I-map,那么就能够从G中读出P的所有独立性,但这种认识是错误的。(不同的构建顺序会产生截然不同的结果)

    P-map

考虑到这一问题,我们的下一个目标变成了找到可以准确刻画P中的所有独立性的图G。定义P-map:对于独立性集I,如果I(k)=I,称图k是I的一个P-map,如果I(k)=I(P),那么成k是P的一个p-map。(条件强于I-map)

我们希望找到分布的P-map,但不幸的是不是所有分布都有P-map。

7. 其他

书中给出了d-分离的算法等,但这些内容我都没有看。书中的贝叶斯网表示这一节中有一个专栏,讨论了诸如变量选择、是否该引入隐变量,结构选择、概率选择等问题。其中那个提到了我们不应该赋值0概率,以及敏感性分析。我想这些都是在实际问题中需要考虑的,但对于这些我都还没有过实践。

或许,阅读、学习只是寻找一点寄托,不然自己整天无所事事闲的发慌吧;这总归是不会失败不会失去太多的生活方式。而实践往往就难很多,需要有机遇、有决心,要付出很大的努力,可能还要面临失败的结果。

时间: 2025-01-06 20:34:41

[PGM] I-map和D-separation的相关文章

(ros/navigation/slam_gmapping) map_server地图服务器

http://wiki.ros.org/map_server 概述 map_server提供map_server ROS节点,它提供地图数据作为一个ROS服务器.也提供map_saver命令行功能,能动态生成保存到文件中的地图. 地图格式 包中通过工具操作的地图是以成堆的文件存储的.YAML文件描述地图的元数据,并命名image文件.Image文件编码占用数据. Image 格式 Image 以对应单元的颜色描述世界中每个单元的占用状态.白色单元格表示自由,黑色单元格表示占用,两种颜色之间的单元

ROS Navigation中的map_server地图包功能和使用

博客参考 http://wiki.ros.org/map_server 和 https://www.ncnynl.com/archives/201708/1897.html 1. 安装map_server sudo apt-get install ros-kinetic-map-server 2. 具体使用说明 map_server使得地图的数据变成 ros 的service 可以被调用.其中以两种方式存储.一个是yaml文件,他存储了数据的元数据.一个是image file   他编码了地图的

图片存储格式 PNM 以及 PBM/PGM/PPM

图片的存储格式之一是PNM--实际上是PBM.PGM.PPM三种格式的统称.这三种格式的语法很接近,分别对就黑白图片.灰度图片和彩色图片. PNM是"Portable Any Map"的缩写. PNM文件可以用程序xview或kview打开. PPM格式的图片 ppm格式可以是二进制的,也可以是纯文本的.两者的区别主要是像素数据用二进制表示还是用纯文本表示. 纯文本格式的PPM非常适合于简单的图片输出--因为不需要复杂的图片处理library. 下面是一个纯文本PPM格式的图片 文件的

在YARN中,如何控制和监控map/reduce的并发数

配置建议: 1.     In MR1, the mapred.tasktracker.map.tasks.maximum and mapred.tasktracker.reduce.tasks.maximum properties dictated how many map and reduce slots each TaskTracker had. These properties no longer exist in YARN. Instead, YARN uses yarn.nodema

PGM学习之七 MRF,马尔科夫随机场

之前自己做实验也用过MRF(Markov Random Filed,马尔科夫随机场),基本原理理解,但是很多细节的地方都不求甚解.恰好趁学习PGM的时间,整理一下在机器视觉与图像分析领域的MRF的相关知识. 打字不易,转载请注明.http://blog.csdn.net/polly_yang/article/details/9716591 在机器视觉领域,一个图像分析问题通常被定义为建模问题,图像分析的过程就是从计算的观点来求解模型的过程.一个模型除了可以表达成图形的形式外,通常使用一个目标函数

PatentTips - Hardware virtualization such as separation kernel hypervisors

BACKGROUND 1. Field Innovations herein pertain to computer virtualization, computer security and/or data isolation, and/or the use of a separation kernel hypervisor (and/or hypervisor), such as to detect and/or prevent malicious code and which may in

初识PGM图片

1.PGM 是便携式灰度图像格式(portable graymap file format),在黑白超声图像系统中经常使用PGM格式的图像. 文件的后缀名为".pgm",PGM格式图像格式分为两类:P2和P5类型. 不管是P2还是P5类型的PGM文件,都由两部分组成,文件头部分和数据部分. P5格式 P5格式的文件,每个像素用可以用二进制表示. 比如有一幅P5格式图像,灰度值可能的最大值为255,它的第一行第一列像素值为100,那么该图像每个像素使用一个字节表示,第一行第一列为数值为1

(ros/navigation)how to build a map using logged data 怎样用记录的数据创建地图

1 how to build a map using logged data 怎样用记录的数据创建地图 描述:怎样用记录的转换和激光扫描数据创建二维地图. 创建地图 1.  如果作为源校验(相对于二进制安装),构建gmapping: rosmake gmapping 2. 获取一个包.有两个选择: 1 用机器人创建一个包 2 下载一个现有的包做测试 任何一种方式,都会得到一个包. 3. 启动核心 roscore 4. 在其他节点启动前,确保use_sim_time设置为true <pre nam

cartographer_occupancy_grid_node provide a bad map for ros-navigation #864

hi!**1.**I use cartographer_node to build 2D map,and use cartographer_occupancy_grid_node to provide a ros map.My configuration file is as follows**[filename: xiaobao_mapbuild.launch]**`<launch> <node name="cartographer_node" pkg="

图片格式PGM缩写

PGM是Portable Gray Map的缩写.它是灰度图像格式中一种最简单的格式标准.另外两种与之相近的图片格式是PBM和PPM.它们分别相应着黑白图像和彩色图像. PGM的数据存放方式相比于JPG来说是非常easy的,由于它不进行数据压缩.自然的PGM的图片的大小也就比較大了.一个120*128 8-bit的灰度图像,PGM的大小是44kb,而将这个图片转化为JPG格式后.大小仅为4kb. 所以.在日常各种网络应用中你是非常难见到PGM图片的,它太浪费流量了. PGM的数据格式就像上面说的