Graph Cuts学习笔记2014.5.16----1

进行了一段时间的论文学习后,现在下载了一些代码,准备从OpenCV跟matlab两个方面着手搭建自己的图像分割平台,计划耗时一个月左右的时间!

昨天去西工大,听了一场Graph
Asia的报告,里面有个Microsoft的人讲述自己怎么写paper。纠正了我一直以来的一个误区:就是做完实验再写paper,这个是不对的,应该像软件工程的开发流程一样,文档先行才对,一遍写文档一边写代码

还有一点感悟就是,关于图像分割这块的内容,大家都做的比较多了,怎么样让自己的工作出彩,还有原创性的idea很重要。

图论方法的主要思想是将图像映射成加权图,把图像像素看作图的顶点,
邻接像素之间的关系看作图的边, 邻接像素之间的相似性看作边的权值, 根据边的权值设计能量函数, 通过最小化能量函数完成对图的分割, 从而实现图像分割.
基于图论的分割方法对图像进行分割时优点明显:

1) 图论是一门研究比较早而且已经发展成熟的学科,
具有较好的数学基础. 针对某个问题, 图论中有多个方法可以解决;

2) 图像和图之间非常相似. 在图像映射为图之后,
便可以利用图论中的各种理论和数学工具进行图像分割.

目前常用的基于图论的分割方法包括最小割
(通常称为图割)、归一化割等. 和图割相比, 归一化割存在以下几点不足:

1) 没有嵌入一元 (Unary) 项,
如各自图结点的先验, 相当于对所有结点都是零先验;

2) 需要计算大矩阵的广义特征向量,
尽管采取了复杂度抑制措施, 计算量仍很大;

3) 只能逼近全局最优解;

4) 倾向于分割出的类具有相同的类内相似度.

因此, 尽管图割容易分离出小目标,
但图割方法的优点更加明显:

1) 在全局最优的框架下进行分割,
保证了能量函数的全局最优解;

2) 同时利用了图像的像素灰度信息和区域边界信息,
分割效果好;

3) 用户交互简单且方便,
只需在目标内部和背景区域标记少量的种子点, 对种子点的具体位置也没有严格要求, 而且通过预处理方法自动确定种子点, 也可让图割方法自动化.

因此, 近 10 年来,
基于图割的图像分割方法的发展和应用尤为广泛. 经典的图割只能精确求解特定的能量函数, 而对其他能量函数需要用线性规划松弛方法来求解, 有两个思路可实现:

1) 基于移动制造的方法, 包括 α 扩展和 α?β
交换等, 不试图精确地求解松弛问题;

2) 基于消息传递的方法, 包括信念传播
(Belief propagation) 和 TRW (Tree-reweightedmessage-passing) 等, 试图精确地求解松弛问题.

参考文献[7]中证明了,最小割等价于能量函数最小化

参考文献

[1] Y. Boykov, and M. P. Jolly, "Interactive graph cuts for optimal
boundary and region segmentation of objects in N-D images
",
Proceeding of IEEE International Conference on Computer Vision,
1:105~112, July 2001.

[2] C. Rother, A. Blake, and V. Kolmogorov, "Grabcut – interactive
foreground extraction using iterated graph cuts
", Proceedings of
ACM SIGGRAPH 2004
, 23(3):307~312, August 2004.

[3] A. Agarwala, M. Dontcheva, M. Agrawala, et al,
"Interactive digital photomontage", Proceedings of ACM
SIGGRAPH 2004
, 23(3):294~302, August 2004.

[4] Y. Li, J. Sun, C. Tang, et al, "Interacting with images:
Lazy snapping
", Proceedings of ACM SIGGRAPH 2004,
23(3):303~308, August 2004.

[5] A. Blake, C. Rother, M. Brown, et al, "Interactive Image
Segmentation using an adaptive GMMRF model
". Proceedings of
European Conference on Computer Vision
, pp. 428~441, May 2004.

[6] V. Kwatra, A. Schodl, I. Essa, et al, "Graphcut
Textures: Image and Video Synthesis Using Graph Cuts
". Proceedings
of ACM Siggraph 2003
, pp.277~286, Augst 2003.

[7] Song-Tao L I U, Fu-Liang Y I N. 基于图割的图像分割方法及其新进展[J]. 自动化学报, 2012, 38(6):
911-922.

时间: 2024-10-19 11:18:35

Graph Cuts学习笔记2014.5.16----1的相关文章

黑马程序员学习笔记2014/7/5

观看视频:011_标识符_黑马程序员_Java基础视频.avi Java语言的基础组成 关键字.标识符.注释.常量和变量.运算符.语句.函数.数组.   关键字     标识符 1.在程序中自定义的一些名称 2.由26个英文字母大小写,数字,0-9符号 :_ $ 组成 3.定义合法标识符的规则: a.数字不可以开头 b.不可以使用关键字 4.Java中严格区分大小写 5.注意:在起名的时候尽量起一个有意义的名称       观看视频:012_常量_黑马程序员_Java基础视频 常量与变量 Jav

每日js学习笔记2014.5.4

<script language="javascript">var mystring = "这是第一个正则表达式的例子";var myregex = new RegExp("这是"); //创建正则表达式if (myregex.test(mystring)) //test的功能是查找字符串中是否有匹配项,有则返回true,没有则返回false{ document.write ("找到了指定的模式");}else{

每日js学习笔记2014.5.5

<script language="javascript"><!-- var textstr = prompt("请输入一个字符串:",""); //prompt的用法,包含两个参数 var regex = /[A-Z][a-z]tion/; //[A-Z]有无匹配项 var result = regex.test(textstr); //test的用法 document.write ("<font size='

oracle__学习笔记2014.09.05

oracle学习笔记2014.09.05 测试数据库配置的信息 全局数据库名:xiuhao 系统标识符(SID):xiuhao 服务器参数文件名:c:\oracle\dbs\spfilexiuhao.ora database control URL: http://C-1:5500/em sys以及system解锁 edit 以文本格式打开当前命令/ / 执行当前命令 l [num] 显示缓存区命令 get [file] 把file中的文件加入到缓冲区 c /[str] /[str] 修改当前语

《深入Java虚拟机学习笔记》- 第16章 控制流

<深入Java虚拟机学习笔记>- 第16章 控制流

scala学习笔记-模式匹配(16)

模式匹配 1 // Scala是没有Java中的switch case语法的,相对应的,Scala提供了更加强大的match case语法,即模式匹配,类替代switch case,match case也被称为模式匹配 2 // Scala的match case与Java的switch case最大的不同点在于,Java的switch case仅能匹配变量的值,比1.2.3等:而Scala的match case可以匹配各种情况,比如变量的类型.集合的元素.有值或无值 3 // match cas

《白帽子讲WEB安全》学习笔记之第16章 互联网业务安全

第16章 互联网业务安全 16.1 产品需要什么样的安全 安全是一个独立的,应该与业务持平. 16.1.1 互联网产品对安全的需求 安全性是产品特性的一个组成部分,具备了安全性,产品才是完整的:安全做好了,产品才是最终正真的成熟. 16.1.2 什么是好的安全方案 我认为好的方案是: q  人性化 q  智能化 q  性价比高 再次强调,安全是产品的一种特性,如果产品能够潜移默化地培养用户的安全习惯,将用户往更安全的行为上引导.那么这就是最好的最理想的产品安全. 16.2 业务逻辑安全 需要在满

读书笔记2014第16本:《视觉繁美:信息可视化方法与案例解析》

阅读加写笔记大概用了6个小时.<视觉繁美>是从权哥的QQ上发现的,看到一堆超炫超复杂的图形,就马上动手从amazon上买了下来.第一天粗翻一遍,确实是非常多.非常复杂的网络图,如果不是搞艺术设计的,真不知道这本书有什么用,但第二天开始仔细阅读,发现前三章还是相当有料,从树状模型开始,过渡到网络模型,然后仔细剖析了网络模型,第四.五.六章可以说是网络图欣赏,第七章是4篇论文. 第一章 生命之树 树状模型是当代网络图的源头.古代把树赋予了神圣的意义,树的根系蜿蜒向下深入土壤,枝叶伸展向上拥抱天空,

算法导论学习笔记 (页码:9 ~ 16)

前面算法在生活中不谈,算法的重要性不谈,直接说算法. 第2章 算法基础 2.1 插入排序 书中主要介绍了插入排序的思想,即对于数组A[0 ~ N - 1],长度为N.那么,升序的插入排序的过程即是从A[1]开始,先和A[0]比较,如果比A[0]小,那么将A[0]的元素顺序后移放置在A[1]中,将原本A[1]的元素插入在A[0]的位置上,同理再拿A[5]举例,如果比A[4]小,那么A[4]后移,继续比较A[3],如果还是小,A[3]后移,直到找到合适的位置进行插入,原书中提供的伪代码,我这里提供对