红外目标图像中阈值分割方法的比较与研究

红外目标图像中阈值分割方法的比较与研究

 

摘要:本文主要以红外图像目标检测技术为背景,在图像阈值分割中以最大熵准则及遗传算法为基础,研究了一维最大熵值法(KSW法)及基于遗传算法的KSW熵法单阈值、双阈值等三种不同的阈值分割方法,并通过实验仿真验证了它们的性能及差异。实验结果表明:基于遗传算法的KSW熵法的双阈值分割方法,可以用于红外型目标检测系统中,并取得良好效果,为了验证其是否具有普适性,在其它科学领域如:沿海码头等方向也做了相应的仿真实验,结果较为满意。

关键词:红外目标检测;阈值分割;最大熵法;遗传算法

Study and compare the method of Infrared target in the image threshold segmentation

Abstract: This article mainly takes the infrared image targets detection techniques as the background, and based on the maximum entropy criterion and genetic algorithm in the image threshold segmentation, to study three different
threshold segmentation method of the one-dimensional maximum entropy method (KSW method) and KSW entropy method based on genetic algorithm of single threshold、double threshold. and
their performance and differences are verified by the experimental simulation . The experimental results show that KSW entropy method based on genetic algorithm of double threshold segmentation method, can be used in infrared target detection system, and achieved
good results. in order to verify its generality in other scientific fields, such as: the coastal wharf direction ,we also make corresponding simulation experiment, the result is satisfactory.

Keywords: infrared target detection; threshold segmentation; the maximum entropy method; genetic algorithm

1 引言(Introduction)

   图像分割是图像处理领域的一个基本问题,也是自动目标识别技术(ATR)中的一项关键技术,是目标特征提取、识别与跟踪的基础。

目前,在众多的图像分割方法中,阈值法以其简单、快速、实用、有效的特点得到了较为广泛的应用。如何选取合理的阈值将目标和背景有效地分离,是阈值法所要解决的关键问题,如果阈值选取过高,则过多的目标点被误归为背景;阈值选取过低,则会出现相反的情况。针对它,目前已作了大量的研究。但至今还未能找到一种对所有图像都能有效分割的阈值选取方法。

基于红外目标图像中目标与背景的对比度较低、边缘模糊,而且很多情况下红外图像中目标的相对面积较小,因而传统的阈值法很难取得好的效果,分割得到的目标可能包含较多的背景信息。本文研究了一维最大熵值法(KSW法)及基于遗传算法的KSW熵法的单阈值、双阈值等三种不同的阈值分割方法,通过实验对这三种方法的性能进行了验证,分析它们的优缺点,并尝试将其运用于其他科学领域中,其中,基于遗传算法的KSW熵法双阈值分割方法展现出较为满意的效果。

2 原理及算法介绍(The principle and algorithm introduction)  

2.1 基本阈值分割原理

设原始灰度图像为,以一定的准则在中找出一个灰度值t作为阀值,将图像分割为两部分,则分割后的二值图像为:

                     (1)

将其推广到双阈值方法,则则分割后的图像为:

                 (2)

其中,为图像的两个不同的阈值分割点,为分割后的图像的一个灰度值,实验中将其设置为180。基于此还可以将其推广到三阈值甚至多阈值分割中,本文仅需要做到双阈值即可,故不作详细介绍。

2.2 最大熵值算法原理

   Kapur 等人所提出的最佳熵阈值方法(本文简称为KSW熵法) ,不需要先验知识,而且对于非理想双峰直方图的图像也可以进行分割。将信息论中Shannon 熵概念用于图像分割时,测量图像灰度直方图的熵,由此找出最佳阈值,其出发点是使图像中目标与背景分布的信息量最大。

首先介绍单阈值分割方法,根据Shannon 熵的概念,对于灰度范围的图像直方图,其熵测量为:

                        (3)

其中是第个灰度出现的概率。设阈值将图像划分为目标和背景两部分,令

                         (4)

                       (5)

图像由阈值分为两部分后,其概率分布分别为:

            

与每个分布有关的熵为,公式如下:

                  (6)

            (7)

则图像的总熵为:

                  (8)

最佳阈值为使总熵取最大值,即:

                        (9)

将其推广到多阈值分割法,当同一背景图像上有多个物体或需要分割不同层次目标时,可采用多阈值分割。最佳熵自动门限法适合于多阈值(设为个阈值)分割. 此时:

(10)

式中,是分割阈值,且有,为使总熵取最大值,即:

             (11)

特别地,,对于双阈值情况,即为 ,则有:

(12)

最佳阈值为使总熵取最大值,即:

                        (13)

2.3 基于遗传算法的KSW熵法

遗传算法(Genetic Algorithm)是一类借鉴生物界的进化规律(适者生存,优胜劣汰遗传机制)演化而来的随机化搜索方法。它是由美国的J.Holland教授1975年首先提出,其主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力;采用概率化的寻优方法,能自动获取和指导优化的搜索空间,自适应地调整搜索方向,不需要确定的规则。

遗传算法是具有“生成+检测”的迭代过程的搜索算法,它的基本处理流程如下:

(1)参数编码。这个要素是要建立一个空间映射,就是问题的解空间与编码空间的映射,每个不同的候选解用有一个单独的串号。

(2)初始群体的设定。将种群进行初始化。

(3)适应度函数的设计。在种群中,将每个个体的染色体进行解码,变成适合计算式适应度的函数形式。

(4)选择。将适应度大的个体作为优秀个体繁殖下一代,适应度越大被选择繁殖下一代的可能性也就越大。

(5)交叉。将选中的两个用于繁殖下一代的位置相同个体的位置进行交叉互换。

(6)变异。按照基因突变的概率翻转串中的基因。

(7)重复步骤(4)到步骤(6)使得结果满足已设定的遗传条件。

将此遗传算法应用于上述KSW熵法,则有如下设计:

2.3.1 KSW单阈值分割的遗传算法设计

(一)编码:由于图像灰度值在0~255 之间,故将各个染色体编码为8 位二进制码,它代表某个分割阈值. 初始代人口的值为随机产生的,其相应的适应度值也各有高低。

(二)人口模型:若人口数过多,则每一代适应度值的计算量大,因此人口数设置应该合理. 在此,设置人口数为10 ,最大繁殖代数为100。

(三)解码:对二进制染色体数组解码为0~255 之间的值,以求其适应度值。

(四)适应度函数:采用公式(8)为适应度值函数。同时采取对适应度函数的线性定标。

(五)选择:根据遗传算法的收敛定理,先进行赌轮法(蒙特卡罗法) ,再采用精英策略。

(六)交叉:交叉互换的重要特征是它能产生不同于父体的子体. 交叉概率越大,交叉操作的可能性也越大;如果交叉率太低,收敛速度可能降低. 单阈值分割由于只有一个参数,所以采用一点交叉,在此设置交叉概率为0.6。

(七)变异:变异概率为0.1。

(八)终止准则:规定当算法执行到最大代数(终止条件) 或经过15 代进化,群体中的最高适应度值仍未发生变化(稳定条件) 时,算法停止运行,具有最高适应度值的个体即为分割阈值。

2.3.2 KSW双阈值分割的遗传算法设计

一、编码:将单阈值分割中的8 位二进制码串改为16 位,前8 位表示一个门限值,后8 位表示另一个门限值。

二、人口模型:双阈值分割属于多参数遗传程序设计,在此设置人口数为20 ,繁殖代数为100。

三、解码:对二进制染色体数组解码为两个0~255 之间的数作为双阈值。

四、适应度函数:采用公式(12) 式为适应度值函数。同时采取对适应度函数的线性定标。

五、选择:根据遗传算法的收敛定理,先进行赌轮法(蒙特卡罗法) ,再采用精英策略。

六、交叉:采用双点交叉,随机产生的两个交叉点分别位于前8 位和后8 位. 交叉概率为0.6。

七、变异:变异概率为0.1。

八、终止准则:在双阈值分割中,规定经过30 代进化群体中的最高适应度值仍未发生变化为稳定条件。

3 实验结果及性能分析(experimental results and performance analysis)

3.1 实验结果(experimental results)

本文所有的实验都是在PC CPU @2.60GHz,4GRAM,Intel(R)Core(TM)i5-3230M 显卡的计算机上做的实验,实验环境为MATLAB R2014a,为了验证本文三种算法阈值分割效果的差异性,本文选取了三幅图像进行仿真,原图分别为3.1(a)的红外飞机图像、3.1(e)的红外手掌图像,3.1(i)的沿海码头图像,仿真过程中,首先将图像转换为256 级的灰度图像,然后分别用三种算法对其进行仿真,获取阈值分割后的图像,详情见各个图像的注解。

图1 红外飞机图像阈值分割结果

Fig. 1  infrared plane image threshold segmentation results

3.1(a) 原始图像的灰度图像  3.1(b) 一维最大熵阈值分割图像 3.1(c)基于遗传算法的KSW熵法单阈值分割图像  3.1(d)基于遗传算法的KSW熵法双阈值分割图像

图2 红外手掌图像阈值分割结果

Fig. 2  infrared palm image threshold segmentation results

3.1(e) 原始图像的灰度图像  3.1(f) 一维最大熵阈值分割图像 3.1(g)基于遗传算法的KSW熵法单阈值分割图像  3.1(h)基于遗传算法的KSW熵法双阈值分割图像

 

 

 

 

 

图3 沿海码头图像阈值分割结果

Fig. 3  coastal terminal image threshold segmentation results

3.1(i) 原始图像的灰度图像  3.1(j) 一维最大熵阈值分割图像 3.1(k)基于遗传算法的KSW熵法单阈值分割图像  3.1(l)基于遗传算法的KSW熵法双阈值分割图像

3.2 性能分析 (performance analysis)

从上述仿真图像结果可以看出:基于遗传算法的KSW熵法双阈值分割算法在图像纹理细节上较前两种分割方法展现出优越的性能,通过实验仿真可以得到上述图像的分割阈值及搜索阈值所消耗的时间,将其统计于表1中,结果如下:

表1 三种算法的性能分析表

table 1  Three kinds of algorithm performance analysis


 


图3.1(a)


图3.1(e)


图3.1(i)


单/双阈值


搜索时间(s)


单/双阈值


搜索时间(s)


单/双阈值


搜索时间(s)


算法1


40


0.173


126


0.165


149


0.656


算法2


76


0.020


115


0.027


149


0.103


算法3


41


165


0.070


76


172


0.154


127


210


0.168

(注:算法1为一维最大熵法,算法2为基于遗传算法的KSW熵法单阈值分割算法,算法3为基于遗传算法的KSW熵法双阈值分割算法。另外由于仿真软件的智能化,同一幅图像在同一种算法中获得的数据存在微妙的差异,所以上述数据也只是相对的)

从表1可以看出:遗传算法作为一种优化算法,用于图像分割时,可以大大缩短寻找阈值的时间,但由于双阀值在搜索空间上比单阀值大很多,所以搜索时间要长一些。

4 结语(Conclusion)

本文针对红外图像目标检测技术,在图像阈值分割中以最大熵准则及遗传算法为基础,研究了一维最大熵值法(KSW法)及基于遗传算法的KSW熵法单阈值、双阈值等三种不同的阈值分割方法,并通过实验仿真验证了它们的性能及差异。实验结果表明:遗传算法作为一种优化算法,用于图像分割时,可以大大缩短寻找阈值的时间,基于遗传算法的KSW熵法的双阈值分割方法,可以用于红外型目标检测系统中,并取得良好效果,为了验证其是否具有普适性,本文在其它科学领域如:沿海码头等方向也做了相应的仿真实验,结果较为满意。

5 参考文献(Reference)

[1]Digital Image Processing, 3rd edition, Rafael C. Gonzalez and Richard E. Woods, Prentice Hall, 2010.

[2]涂建平,彭应宁.飞机目标红外图像序列双阈值分割方法[J].兵工学报,Vol. 25 No. 1 Jan. 2004.

[3]王文渊,王芳梅.改进的最大熵算法在图像分割中的应用[J].计算机仿真,2011.

[4]种劲松,周孝宽,王宏琦.基于遗传算法的最佳熵阈值图像分割法[J].北京航空航天大学学报,1999, 25 (6): 747~750.

[5]刘国华,包宏,李文超.用MATLAB实现遗传算法程序[J].计算机应用研究, 2001.

时间: 2024-10-09 03:27:40

红外目标图像中阈值分割方法的比较与研究的相关文章

python数字图像处理(11):图像自动阈值分割

图像阈值分割是一种广泛应用的分割技术,利用图像中要提取的目标区域与其背景在灰度特性上的差异,把图像看作具有不同灰度级的两类区域(目标区域和背景区域)的组合,选取一个比较合理的阈值,以确定图像中每个像素点应该属于目标区域还是背景区域,从而产生相应的二值图像. 在skimage库中,阈值分割的功能是放在filters模块中. 我们可以手动指定一个阈值,从而来实现分割.也可以让系统自动生成一个阈值,下面几种方法就是用来自动生成阈值. 1.threshold_otsu 基于Otsu的阈值分割方法,函数调

第十四节,OpenCV学习(三)图像的阈值分割

图像的阈值处理 图像的阈值分割:图像的二值化(Binarization) 阈值分割法的特点是:适用于目标与背景灰度有较强对比的情况,重要的是背景或物体的灰度比较单一,而且总可以得到封闭且连通区域的边界. 一.简单阈值 选取一个全局阈值,然后把图像分成非黑即白的二值图像. cv2.threshold()[源图像矩阵,进行分类的阈值,高于(低于)阈值时赋予的新值,方法选择参数] 返回两个值:阈值,阈值处理后的图像矩阵. cv2.THRESH_BINARY(黑白二值) cv2.THRESH_BINAR

Python对DICOM图像进行阈值分割

Python对Dicom图像进行处理,离不开pydicom,opencv-python,matplotlib,numpy四个代码库,安装完成这四个代码库后, 可以读取Dicom图像,并对图像进行处理,显式处理后的结果,下面就举例说明: import cv2 import numpy import dicom from matplotlib import pyplot as plt # 读取单张Dicom图像 dcm = dicom.read_file("../Data/vhm.420.dcm&q

基于Otsu算法的图像自适应阈值分割

在图像处理实践中,将灰度图转化为二值图是非常常见的一种预处理手段.在Matlab中,可以使用函数BW = im2bw(I, level)来将一幅灰度图 I,转化为二值图.其中,参数level是一个介于0~1之间的值,也就是用于分割图像的阈值.默认情况下,它可取值是0.5. 现在问题来了,有没有一种根据图像自身特点来自适应地选择阈值的方法呢?答案是肯定的!我们今天就来介绍其中最为经典的Otsu算法(或称大津算法).该算法由日本科学家大津展之(Nobuyuki Otsu)于1979年提出.这个算法看

目标检测中背景建模方法

最近一直在做前景检测方面的研究,刚开始主要是做一些工程性的应用,为了解决工程方面的问题,下了不少功夫,也看了不少最近国内外的文章.一直想做个总结,拖着拖着,终究却写成这篇极不成功的总结.      背景建模或前景检测的算法主要有: 1. Single Gaussian (单高斯模型) Real-time tracking of the human body 2. 混合高斯模型(Mixture of Gaussian Model) An improved adaptive background m

OpenCV笔记(十一)——图像的阈值操作(一种分割的方法)

对图像进行阈值的操作,可以认为是一种简单的分割前景和背景的方法. 这种分割的方法一般用在前景像素和背景像素的强度值反差比较明显的情况下,如下图: 我们可以看到这幅苹果的图像,代表前景的是苹果,代表背景的是白色部分.这幅图像前景背景分明,所以可以取一个阈值,如200.在图像中,凡是灰度低于200的像素,我们认作是前景,将其值设为255,凡是灰度不低于200的像素,我们认作是背景,将其值设为0.获得一张新的Mask,将原始的图像与这张Mask做与(&)运算,就能够得到分割好的图像. 一般来说,阈值化

OpenCV中通过滑动条阈值分割多通道图像

1.阈值分割 阈值分割法是一种基于区域的图像分割技术.其基本原理是:通过设定不同的特征阈值,把图像象素点分为若干类.根据图像阈值化算法所依据的信息源,可将阈值化方法分为五类:1) 基于聚类的方法:数据聚类中,总的数据集被划分为属性相似的子类,例如将灰度级聚类成为两部分:前景物体部分和背景部分.2) 基于直方图的方法:在直方图的峰.谷和直方图的圆滑曲线上进行分析.3) 基于熵的方法:熵方法将区域分为背景区域和前景区域,前景区域通常是物体部分(在一些热红外图像中,背景部分是物体) .该方法是通过最小

基于深度学习的图像语义分割方法综述

近年来,深度学习技术已经广泛应用到图像语义分割领域.主要对基于深度学习的图像语义分割的经典方法与研究现状进行分类.梳理和总结.根据分割特点和处理粒度的不同,将基于深度学习的图像语义分割方法分为基于区域分类的图像语义分割方法和基于像素分类的图像语义分割方法.把基于像素分类的图像语义分割方法进一步细分为全监督学习图像语义分割方法和弱监督学习图像语义分割方法.对每类方法的代表性算法进行了分析介绍,并详细总结了每类方法的基本思想和优缺点,系统地阐述了深度学习对图像语义分割领域的贡献.对图像语义分割相关实

C#中的bitmap类和图像像素值获取方法

一.Bitmap类 Bitmap对象封装了GDI+中的一个位图,此位图由图形图像及其属性的像素数据组成.因此Bitmap是用于处理由像素数据定义的图像的对象.该类的主要方法和属性如下: 1. GetPixel方法和SetPixel方法:获取和设置一个图像的指定像素的颜色. 2. PixelFormat属性:返回图像的像素格式. 3. Palette属性:获取和设置图像所使用的颜色调色板. 4. Height Width属性:返回图像的高度和宽度. 5. LockBits方法和UnlockBits