基于图像分割的目标识别

1. 图像分割的背景与意义

在应用方面,由于图像分割是从图像处理到图像分析的重要一步,所以自从它的产生到现在,一直受到人们的高度重视。它主要起源于上世纪70年代的电影行业。至今为止,随着我们科技的不断进步,我们也提出了许多种图像分割的算法,并且也有了不小的成绩,而且图像分割也已经在我们的生活中的各个领域得到了广泛的应用,例如在在线产品检验、生产过程控制、文档图像处理、工业自动化、遥感、生产过程控制和生物医学的图像分析,以及体育、农业、军事工程等方面。但是,到目前为止我们还没有一种较为通用的分割方法[2],我们目前所提出的各种方法,它们大都是在分析了具体的问题后才来提出的,并不一定适用于其他的问题。另外,正是由于这一点,目前我们也还没有制定出合适的图像分割算法的标准,也因此我们的目标识别的方法也是不确定的。在实际的生活中,还存在着许多的问题有待我们去解决。

在技术发展方面,早在上世纪60年代就有人提出了边缘检测方法,也因此产生了不少经典的算法[3]。由于图像分割技术在图像处理及图像分析的过程中的重要作用,越来越多的学者都开始将注意力转到寻找新的理论和方法来提高图像分割的质量,以满足人们在实际生活中各方面的需求。目前有许多学者尝试着将遗传算法理论、数学形态学、小波变换理论、分形理论和模糊理论等研究成果运用到图像分割中,产生了结合特定数学方法和针对特殊图像分割的先进图像分割技术,例如多种特征融合的分割方法,多种分割方法结合的分割方法等。

2. 图像分割

现在主要有几种类型的分割技术,分别是:阈值法[4],以边界为基础的方法,以区域为基础的方法[5],以混合动力为基础的技术,以小波变换为基础的分割方法[6],自动区域生长的彩***像分割方法等。

2.1阈值分割方法

阈值分割法是一种最常用的并行区域技术,它是图像分割中应用数量最多的一类。阈值分割方法实际上是输入图像f到输出图像g的如下变换:

                                                   (1)

其中,T为阈值,对于物体的图像元素g(i,j)=l,对于背景的图像元素g(i,j)=0。由此可见,阈值分割算法的结果在很大程度上是受阈值[7]影响的,所以关键是如何选择一个合适的阈值。如果能确定一个合适的阈值,那我们就可准确地将图像分割开来。阈值确定后,我们将阈值和像素点的灰度值进行逐个的比较,而且像素分割和比较可以同时进行,于是分割的结果就能直接给出图像区域。

到目前为止,人们已经发展了各种各样的阈值处理技术。总的来说,阈值法主要包括全局阈值法和局部阈值法两种方法[8]。全局阈值是指利用整个图像的信息来对这整幅图像做分割处理。它是根据整幅图像的阈值来确定的:T=T(f),它一般适用于背景和前景有明显对比的图像。但是这种方法由于只是参考了像素本身的灰度值,而没有考虑到它其他的空间特征,因而对噪声很敏感。局部阈值法就是先把这幅图像分为几个局部的区域,然后再逐个地对这些区进行全局阈值的处理,得出最好的阈值。由于在许多情况下,物体和背景的对比度在图像中的各个部位是不一样的,所以这时候很难用一个统一的阈值就能将物体与背景分割开。这时我们就可以先根据图像的局部特征,用局部阈值法进行分割,得到我们所需要的最优阈值。求解最优的阈值时,我们就需要按照具体问题具体分析。常用的阈值选取方法主要有以下几种,分别是:利用图像灰度直方图的峰谷法、最小误差法、最大类间方差法、最大熵自动阈值法以及其它一些方法。阈值的选择需要根据具体问题来确定,一般通过实验来确定。

阈值分割的优点是计算简单、运算效率较高、速度快。因此它在我们现在的生产生活中的各个领域得到了广泛的应用。

2.2 区域分割方法

区域分割的实质就是把具有某种相似性质的像索的区域合并,不同性质的区域分割开,从而形成最终的分割区域。它主要是根据图像的灰度、纹理、颜色和图像像素统计的均匀性等图像的空间局部特征,来把图像中的各个像素划分到各个子区域中,进而将图像分割成若干个不同的子区域。在此类方法中,如果我们根据前面就定义好的准则将像素或者子区域集合到一起,形成一个更大的区域的过程,我们通常称之为区域生长的分割方法,它主要考虑像素及其空间邻域像素之间的关系。

对于区域生长的分割方法,首先, 我们将彩***像从RGB彩***形中转换到Y Cb Cr颜色空间当中。其次,通过自动应用的方法选种获得了初始的种子。第三,种子区域生长的算法用于将图像分割成多个不同的区域,而且每个区域对应于一个种子。第四,我们将区域的合并算法应用于合并相似的区域,并且把小的区域合并到离他们最近的邻近的区域当中去。现在有几种比较经典的生长准则:基于区域灰度差的准则;基于区域灰度分布统计性质的准则;基于区域形状的准则[9]。这种区域生长的分割方法容易出现过度分割的情况,过度分割会破坏目标图像的完整性,会让我们得不到某些预期的结果。

对于区域分裂合并的分割方法,它的过程其实和区域生长的过程很相似,只是顺序倒了一下。它主要是从整个图像出发,不断分裂得到各个子区域,然后再把前景区域合并,实现目标提取。分裂合并的若是对于一幅图像,前景区域由一些相互连通的像素组成的,因此,如果把一幅图像分裂到像素级,那么就可以判定该像素是否为前景像素。当所有像素点或者子区域完成判断以后,把前景区域或者像素合并就可得到前景目标。最常用的方法是四叉树分解法。这种分割方法比较复杂,计算量比较大。分裂的过程可能会使区域的边界被破坏。

2.3自动区域生长的彩***像分割方法

种子区域生长(即Seeded Region Growing,SRG)是一种由Adams和Bischof[10]提出的图像分割的混合方法。之后Mehnert和Jackway[11]也指出,SRG有两种内在的像素顺序依赖性,这两种依赖性会导致不同结果的分割。第一种顺序依赖,无论何时几个像素有差异同样的度量对于其周边地区。第二种顺序依赖性,一个像素具有差异相同的度量对于几个区域。他们使用并行处理,并重新检查,以消除顺序依赖关系。Fan 等人[12]提出了一种自动彩***像分割算法,通过集成边缘渐变贴图插件提取和种子区域生长在YUV色彩空间。在Y,U和V的边缘由一个各向同性的边缘检测器检测,三个部分相结合,以获得边缘。相邻边缘区域的重心被作为初始的种子。缺点是它们的种子生成过多。

3. 目标识别

目标图像在经过图像分割处理后,我们就需要把我们所需要的那部分图像给识别出来。目前我们一般采用的基于图像分割的方法有:Hausdorff距离[13]、image context、主元分析等几种目标识识别方法。

3.1 Hausdorff距离

Hausdorff距离是描述两组点集之间相似程度的一种量度值,它是两个点集之间距离的一种定义形式,定义如下:假设有两组点集合,分别为A={a1,…,a p},B={b1,…,b q},那么这两个点集合之间的Hausdorff距离定义为

H(A,B)=max(h(A,B),h(B,A))                                                             (1)

其中,

h(A,B)=max(a∈A)min(b∈B)‖a-b‖                                                       (2)

h(B,A)=max(b∈B)min(a∈A)‖b-a‖                                                       (3)

‖·‖是点集A和B点集间的距离dB(a)的最大值.

由上式可知,式(1)称为Hausdorff距离;式(2)中的h(A,B)和h(B,A)分别称为从A集合到B集合和从B集合到A集合的单Hausdorff距离.即h(A,B)实际上首先对点集A中的每个点ai到距离此点ai最近的B集合中点b j之间的距离‖ai-b j‖进行排序,然后取该排序中的最大值作为h(A,B)的值h(B,A)同理可得.

由式(1)知,Hausdorff距离H(A,B)是取h(A,B)和h(B,A)两者中的较大者,从而我们就可以获得A集合和B集合之间的匹配程度。它的优点是计算比较容易,但是匹配度不好,如果目标图像中的噪声过多,那么它的匹配的精确度就会被影响。

3.2 主元分析法

主元分析法,即Principal Components Analysis(PCA),是一种统计技术,经常应用于人面部识别和图像压缩以及信号去噪等领域,是在高维数据中对数据进行降维处理,将多个变量降维,以便于我们计算与分析图像的一种比较有效的方法。

主元分析法是最早是由霍特林在1933年提出来的,其主要目的就是将高维数据投影到较低维的空间上。新产生的映射空间是由原始数据变量的线性组合构成,这样就能很有效的降低投影空间的维数。又因为投影空间统计特征向量彼此正交,所以消除了变量间的关联性,而使得原始过程特性分析的复杂程度得到了大大的简化。

假设一个要研究的系统仅包含两个变量x1,x2。将两个变量的样本点表示在一个平面图上(如图1所示),可以看出所有的样本点集中在一个扁型的区域内。因为样本点之间的差异显然是由于x1,x2的变化而引起的。我们可以看出在沿着横轴的方向上(y1)的变动较大,而纵轴方向上( y2 )的变动较小。这说明了

样本点的主要变动都体现在横轴方向上,比如 80%以上,那么这时就可以将 y 2忽略而只考虑y1 。这样两个变量就可以简化为一个变量了。我们称 y1 , y 2分别为 x1 , x2 的第一主元和第二主元。一般情况下,如果样本有 p 个变量,若样本之间的差异能由 p 个变量的 K 个(K<p)个主元成分来概括,那么就能用 K 个主元来代替 p 个变量。

目前在主元个数的选择上,有两种比较普遍的方法,一种使主元回归检验法,一种是主元贡献率累积和百分比法(CPV)。

4.总结与展望

在图像分割技术产生与发展的这几十年中,越来越多的学者开始将数学形态学、模糊理论、遗传算法理论、分形理论和小波变换理论等研究成果运用到了图像分割中,产生了结合特定数学方法和针对特殊图像分割的更先进的图像分割技术,但是现阶段还是没有一种通用的分割方法,有很多问题还有待我们去解决。因此,提出一种更加通用的图像分割方法显得多么的重要,并且这个的前景是多么的好。可以大胆预见,图像分割技术正随着现代科技的不断进步不断地朝着一种更加先进的分割技术的方向发展,在不久应该就可以提出一种较为通用的分割方法,然后就可以确定一种更为简便的目标识别方法。

基于图像分割的目标识别

时间: 2024-11-13 00:12:30

基于图像分割的目标识别的相关文章

基于图像分割的目标识别的研究

1.课题研究的背景 图像分割是把图像分成几个特定的区域,然后提取出所需的对象目标的技术和过程.由于图像分割是从图像处理到图像分析的重要一步,所以自从它的产生到现在,一直受到人们的高度重视.而且图像分割的结果是图像特征提取和识别等图像理解的基础,对图像分割的研究也一直是数字图像处理技术的焦点和热点.它主要起源于上世纪70年代的电影行业,从图像分割技术产生发展到现在的这几十年中,随着我们科技的不断进步,我们也提出了许多种图像分割的算法,并且也有了不小的成绩,而且图像分割也已经在我们的生活中的各个领域

基于图像分割的立体匹配方法

1.绪论 立体匹配是三维重建系统的关键步骤,并且作为一种非接触测量方法在工业以及科研领域具有重要的应用价值.为了完成匹配工作以及获取场景的稠密视差图,可以通过构建能量函数对应立体匹配的约束条件.复杂能量函数的全局最优解通常是NP难问题.相对于其他全局优化算法相比如模拟退火.梯度下降.动态规划等,图割算法不仅精度高,收敛速度快,并且对于光照变化.弱纹理等区域的匹配效果也比其他算法好. 2.图割算法 计算机视觉领域的大部分问题可以转换为标号问题,在立体匹配中视差的求解就是对图像的像素在视察范围内的离

PGM学习之七 MRF,马尔科夫随机场

之前自己做实验也用过MRF(Markov Random Filed,马尔科夫随机场),基本原理理解,但是很多细节的地方都不求甚解.恰好趁学习PGM的时间,整理一下在机器视觉与图像分析领域的MRF的相关知识. 打字不易,转载请注明.http://blog.csdn.net/polly_yang/article/details/9716591 在机器视觉领域,一个图像分析问题通常被定义为建模问题,图像分析的过程就是从计算的观点来求解模型的过程.一个模型除了可以表达成图形的形式外,通常使用一个目标函数

马尔科夫随机场

之前自己做实验也用过MRF(Markov Random Filed,马尔科夫随机场),基本原理理解,但是很多细节的地方都不求甚解.恰好趁学习PGM的时间,整理一下在机器视觉与图像分析领域的MRF的相关知识. 转载于http://blog.csdn.NET/polly_yang/article/details/9716591 在机器视觉领域,一个图像分析问题通常被定义为建模问题,图像分析的过程就是从计算的观点来求解模型的过程.一个模型除了可以表达成图形的形式外,通常使用一个目标函数来表示,因此建模

[文献阅读] Segmentation and Image Analysis of Abnormal Lungs at CT: Current Approaches, Challenges, and Future Trends

摘要: 肺部分割即计算机确定肺与周围胸部组织边界的过程,是图像分析的重要的一步.然而,几乎现在所有的图像分割方法仅适用于只有很少或没有病理情况.当中度或大量的疾病或异常的具有挑战性的形状或外观存在于肺部时,由于不准确的分割,计算机辅助检测系统可能是很可能无法描绘这些不正常的区域.特别是,如胸腔积液,实变,和大量的不准确分割,大大限制了在临床研究中使用图像处理方法.在本文中,提出了基于CT图像的肺实质分割方法的批判性总结,尤其对异常和典型的病理检查结果方法的精度和性能进行了特别强调. 现有的分割方

机器人视觉识别技术简介

基于颜色特征的物体识别系统对于不同颜色的分别提取和识别 (以上两幅图片由某大学机器人实验室负责人暨机器人天空主编Liu Weichao友情提供) 随着计算机科学和自动控制技术的发展,越来越多的不同种类的智能机器人出现在生产生活中,视觉系统作为智能机器人系统中一个重要的子系统,也越来越受到人们的重视. 视觉系统是一个非常复杂的系统,它既要做到图像的准确采集还要做到对外界变化反应的实时性,同时还需要对外界运动的目标进行实时跟踪.因此,视觉系统对硬件和软件系统都提出了较高的要求.目前比较流行的足球机器

亚像素边缘检测评述

转载请注明出处:http://blog.csdn.net/lsh_2013 1 引言 数字图像的边缘检测是图像分割.目标识别.区域形状提取等图像处理领域的重要基础.在进行图像理解和分析时,第一步往往是边缘检测.目前边缘检测已经成为机器视觉领域最活跃的课题之一,其研究具有非常重要的理论意义和实际应用价值.传统的边缘检测方法的检测精度最高只能达到一个像素级,但是,随着科学技术的飞速发展,工业检测等应用对精确度的要求不断提高,传统的像素级边缘检测方法已经不能满足实际测量的需要,本文重点介绍的亚像素边缘

EBImage - - 给图片增加字符

EBImage中文文档 英文版出处:http://www.bioconductor.org/packages/release/bioc/vignettes/EBImage/inst/doc/EBImage-introduction.html ebimage提供通用的图像处理和分析功能.这允许使用R编程语言的这样的任务的自动化,并有利于在R环境中的信号处理,统计建模,机器学习和可视化与图像数据的其他工具的使用. 1 安装EBImage. ebimage是R包分布作为BioConductor计划的一

《Segment-Tree based Cost Aggregation for Stereo Matching》读后感~

前段时间整理博客发现,自己关于立体匹配部分的介绍太少了,这可是自己花了一个季度研究的东西啊!读了自认为大量的文章,基本上有源码的都自己跑了一遍,还改进了多个算法.不写写会留下遗憾的,所以打算在立体匹配这一块多谢谢博客,一来用于分享,二来用于请教,三来用于备忘.本文介绍的文章就是CVPR2013的<Segment-Tree based Cost Aggregation for Stereo Matching>一文,介绍它原因有以下几点: 1.它是NLCA的变种. 2.它是CVPR的文章. 本文还