分水岭超像素

前言:

超像素这个概念被提出以来,各种方法层出不穷~在计算机视觉和模式识别中也被广泛的应用。最近几年,CVPR,ICCV,PAMI,TIP,ICIP等各种期刊、会议关于超像素的论文超多。其实,这也说明了一个问题,超像素的实现其实很简单,所以才蹦出那么多算法的文章来....

其实早在2010年冬天,帮同学下载一篇论文,就是大名鼎鼎的 Turbo Pixel,PAMI上的一篇文章,同学是想把这个跟遥感结合以下,搞来应用一下。论文下载下来一看,我去...这不是很普通嘛,为啥能发PAMI。顺便去下载了作者的代码,那叫一个慢啊......以我这个性,480*320的图一秒钟跑不出来结果我就直接关掉了...

因为我本身是搞遥感图像处理的,对什么分水岭算法、Meanshift算法、多尺度区域合并等等钻研的比较多,各种算法也都自己实现了一遍。转念一想,这玩意儿有啥难啊?我现有的算法加点儿料,就能出同样的效果了....然后就开始动手改我自己写的分水岭算法... 结果当天晚上就搞定了....算法效率比Turbopixel快了不知道多少倍,普通大小481*321的图片一点就开,毫无延迟,顺便就把TurboPixel鄙视了一番。搞遥感的人对计算机视觉的热点一点都不敏感...直到第二年又发现了PAMI上出了SLIC的文章,又是一篇超像素的文章...于是决定动手把这个写个文章。奈何写作水平就那样,原理太简单了,都没啥高深的理论,墨迹了很久终于墨迹出来两页纸,哪儿也投不了。最后终于找到一个收短文的期刊,Electrics
Letters, 正合我意,却不想被人家鄙视了,连审稿意见都没有....从此这个文章就沉默了三年半。直到14年底,某师兄说投了个ICIP的论文,有没有材料再搞一个?反正注册一个人可以覆盖3篇论文的费用...于是又重新搞出来,跟师兄一起扩充到了5页。这里不得不说,写作能力很重要,我就只能写2页,被师兄指导着写成了5页...然后..就中了。。

正题:

传统的分水岭,特别是Meyer的标记分水岭算法,是以影像的梯度级作为地形表面,梯度值高的地方地形高。这么一看,就形成了一系列坑坑洼洼的盆地。如果从坑里冒水出来了,那么这些盆地就会蓄水,形成一堆堆的水坑。水一直涨,不同的水坑就会合并,如果强制修筑堤坝,不让这些水坑连在一起,那么一个个的水坑最后就成为匀质的区域。那么在水从底部开始积累的时候,总是会先淹没地形的低洼处(梯度值较小的地方),因此,可以理解为这些低洼处具有较高的优先级。(这里如果不明白,可以参考一下分水岭算法的具体原理,用必应搜索 watershed
transform,有个主页讲这个)。

但是,实际中,大家可以发现,荷叶上的水珠,总是呈现出比较规整的外形,为什么呢?其实是 因为水滴的外形不仅受重力作用的影响会流向低处,还会受到内在的张力约束而保持紧凑的外形。因此,如果从微观的角度来重新考虑标记分水岭算法,水坑形成的过程就不仅仅只流向梯度最低处了,还应该有形状上的约束。那么,我们要做的就是考虑怎么加入这个形状约束?

跟传统的超像素类似,首先我们设定一些均匀分布的种子点。假设水只能从这些洞洞中涌出来,然后去形成水坑,使水坑继续膨胀。那么,当水从坑的底部冒出来的时候,其必然使水坑变大,往外扩张。这时候,我们给他一个力,使之往外扩的时候,受到张力的影响而保持紧凑。当然,当水珠越小的时候,张力越大,水珠越大的时候,外围的张力越小。

因此,我们定义这样一个公式:

红框里面表示由梯度决定的优先级,蓝色框里面表示由张力决定的优先级。(水滴膨大过程中,从优先级最高的点开始向外扩张)。

我们定义以上公式来描述张力,即距离越远,优先级越低。同时,为了保护边缘,使得边缘越强,优先级更低。E(x,y)表示边缘的强度。

最后梳理一下这个算法的步骤:

(1) 计算梯度

(2)根据超像素个数,均匀的布设种子点(泉水眼);

(3)模拟泛洪过程,淹没整个地形。跟传统标记分水岭唯一不同的就是在定义像素的处理优先级上,动了一点手脚。

由于分水岭本身超高的效率,使用这个算法的优点也没明显,高效!

最后,给出两张论文图:

有兴趣的同学同学可以参考论文: Watershed Superpixel,  IEEE ICIP2015

相关的可执行代码可以去这里下载:

http://download.csdn.net/detail/guzenyel/9197835

有问题欢迎QQ 409978033交流

时间: 2024-10-23 15:26:24

分水岭超像素的相关文章

超像素 superpixels 是什么东西

毕业设计要做图像分割 识别什么的. 看论文看到 superpixels 开始脑补是  像素插值算出来的 后来越看越不想,搜索发现根本是另外一回事 http://blog.sina.com.cn/s/blog_50363a7901011dtd.html 有定义 Many existing algorithms in computer vision use the pixel-grid as the underlying representation. For example, stochastic

超像素分割, 并获取每一个分区

参考.学习自Greatpyimagesearch from skimage.segmentation import slic from skimage.segmentation import mark_boundaries from skimage.util import img_as_float import matplotlib.pyplot as plt import numpy as np import cv2 # args args = {"image": './hand_0

Python爬取CSDN博客文章

之前解析出问题,刚刚看到,这次仔细审查了 0 url :http://blog.csdn.net/youyou1543724847/article/details/52818339Redis一点基础的东西目录 1.基础底层数据结构 2.windows下环境搭建 3.java里连接redis数据库 4.关于认证 5.redis高级功能总结1.基础底层数据结构1.1.简单动态字符串SDS定义: ...47分钟前1 url :http://blog.csdn.net/youyou1543724847/

二十一 分水岭算法

一.原理 分水岭算法主要用于图像分段,通常是把一副彩色图像灰度化,然后再求梯度图,最后在梯度图的基础上进行分水岭算法,求得分段图像的边缘线. 任意的灰度图像可以被看做是地质学表面,高亮度的地方是山峰,低亮度的地方是山谷.给每个孤立的山谷(局部最小值)不同颜色的水(标签),当水涨起来,根据周围的山峰(梯度),不同的山谷也就是不同的颜色会开始合并,要避免这个,你可以在水要合并的地方建立障碍,直到所有山峰都被淹没.你所创建的障碍就是分割结果,这个就是分水岭的原理,但是这个方法会分割过度,因为有噪点,或

扫盲记-第三篇--图像分割

学习内容来源于网络 图像分割 图像分割是什么?如果下学术定义,就是把图像分割成想要的语义上相同的若干子区域,看上面的自动驾驶的分割任务,路是路,车是车,树是树.这些子区域,组成图像的完备子集,相互之间不重叠.图像分割可以被看作是一个逐像素的图像分类问题. 传统办法: 边缘与阈值法 简单的边缘检测曾被用于图像分割,但需要做复杂后处理.阈值法的基本思想是基于图像的灰度特征来计算一个或多个灰度阈值,并将图像中每个像素的灰度值与阈值相比较.最广泛使用也最具有代表性质就是OTSU方法,它是用于灰度图像分割

matlab dist函数

dist——欧式距离加权函数(Euclidean distance weight function) 语法: Z = dist(W,P)    df = dist('deriv')    D = dist(pos) 描述:dist是一个欧式距离加权函数,给一个输入使用权值,去获得加权的输入. 1.dist(W,P)中:W——S×R的权值矩阵:P——R×Q的矩阵,表示Q个输入(列)向量 2.dist('deriv')返回‘’,因为dist没有导函数. 3.dist也是一个层距离函数,可以被用来寻找

CNN卷积神经网络新想法

最近一直在看卷积神经网络,想改进改进弄出点新东西来,看了好多论文,写了一篇综述,对深度学习中卷积神经网络有了一些新认识,和大家分享下. 其实卷积神经网络并不是一项新兴的算法,早在上世纪八十年代就已经被提出来,但当时硬件运算能力有限,所以当时只用来识别支票上的手写体数字,并且应用于实际.2006年深度学习的泰斗在<科学>上发表一篇文章,论证了深度结构在特征提取问题上的潜在实力,从而掀起了深度结构研究的浪潮,卷积神经网络作为一种已经存在的.有一定应用经验的深度结构,重新回到人们视线,此时硬件的运算

朱松豪,你偷走了我的国奖梦!

摘要:南京邮电大学是一所历史悠久的名校,却被个别教师的劣行而玷污,不早日将其革除,南邮如何振兴?本文首先介绍了南邮的辉煌历史和卓越成就.然后就自动化学院朱松豪师门对国家奖学金近乎垄断的现状进行陈述,罗列其为了通过学生获取国家奖学金而做出的卑劣手段,陈列大量由其撰写而以学生为一作的垃圾论文.最后望人民群众发出正义的呼声,让败类滚出校园. 关键词:国家奖学金:朱松豪:败类: 南京邮电大学前身是1942年诞生于山东抗日根据地的战邮干训班,是我党.我军早期系统培养通信人才的学校之一.1949年8月,学校

总结一些机器视觉库

通用库/General Library OpenCV   无需多言. RAVL  Recognition And Vision Library. 线程安全.强大的IO机制.包含AAM. CImg  很酷的一个图像处理包.整个库只有一个头文件.包含一个基于PDE的光流算法. 图像,视频IO/Image, Video IO FreeImage DevIL ImageMagick FFMPEG VideoInput portVideo AR相关/Augmented Reality ARToolKit