目前相对传统的显著性检测方法主要分为两类:
一类是纯数据驱动独立于任务的自底而上的显著性检测方法(主要基于生物学原理),另一类是受意识支配依赖于任务的自顶而下的显著性检测方法(主要基于机器学习)。
自顶而下的图像显著性检测方法
自顶而下的显著性模型一般包括特征学习和显著性计算两个部分。
由于人类自顶而下的选择注意由高层的脑部信息所控制,对于同一场景不同的人注意的结果不同,其动机、情感等因素比较难以控制和分析,因此构建自顶而下的显著性模型比较复杂,所以对于这类显著性模型的研究不是很多。
自底而上的图像显著性检测方法
1.特征提取:常用的有颜色特征、纹理特征、形状特征、运动特征、局部特征、图像频率(相对较新)等
颜色特征:数字图像采用的基本颜色表示是RGB,常用的其它颜色表示空间有CMYK,CIE XYZ,CIE Luv,CIELAB,YUV,HSV,HIS等。
CIELAB颜色特征是显著性检测中最常使用的图像特征,也是目前为止显著性检测中最为高效的特征。,因为CIELAB颜色模型将亮度和色度分量分开,更加接近人类视觉特性。研究显示,视觉对亮度的敏感度远远不如色度,所以可以推论之,色度和亮度的感受神经细胞是互相独立的。这与CIELAB颜色模型一致。
2.通过选择上述的几种特征得到特征图。
3.之后进行特征显著性计算,包括多尺度比较方法、区域比较方法、全局均值比较方法等方法。
显著性检测标准
1) 突出的最为显著的物体
2) 一致的高亮整个显著物体
3) 精确符合物体的边界
4) 较高的抗噪性
5) 全分辨率
自底而上的显著性检测方法实例可以看一下itti的经典方法
应用
简单看了一些有关显著性检测应用的论文,有以下应用实例:
图像压缩:通过显著性检测方法获得图像的感兴趣区域,通过对不同的区域采用不同的压缩方法使得压缩后的图像中感兴趣区域的清晰度比非感兴趣区域感更高,提高压缩质量。
视频显著性检测:考虑相邻帧之间的相关性,通过帧内计算和相邻帧之间的比较来计算每个区域的显著性程度。
视频的显著性检测还能应用在视频目标跟踪,运动检测,视频压缩等领域。
自动抠图:对图像进行显著性的计算,大致分割出前景和背景,从而自动生成标注前景、背景、未知区域的三色图;最后,使用抠图算法就可以无须人工完成自动抠图。
显著性检测相关的生物学原理
另外附上显著性检测的一些重要生物学原理
Center-surround原理
典型的视觉神经元只有一个小区域比较敏感,这个小区域被称为中心。如果在中心周围的区域也产生刺激,那么这个刺激会抑制中心对视觉神经元的刺激。这种结构使得视觉神经元对局部空间不连续性比较敏感,特别适合检测出与局部周围环境相比比较突出的位置。这也是视网膜、外侧膝状体和初级视觉皮层的工作原理。这可以说是采用局部对比度进行显著性检测的理论基础。
双色对立原理
在大脑皮层中有一个中心区域对信号的接受能力较强,在两种颜色同时刺激该区域的时候,一种会使其兴奋,另一种会抑制其兴奋。这种机制被称为双色对立。而在神经元周围的区域,情况恰好相反。这种存在于绿色和红色、黄色和蓝色之间的上色对立机制通常是在宽频调谐的绿色和红色、黄色和蓝色颜色特征之上建立的。
对比度原理
对比度可以是纹理上的、也可以是形状上的或者是颜色上的,对比度的大小反映出了一个区域和其周边区域存在的差异程度的大小,因此对比度越大的物体,它们之间的显著性越大,越能够吸引人们的注意。