对现实中物体的描述一定要在一个十分重要的前提下进行,这个前提就是对自然界建模时的尺度。当用一个机器视觉系统分析未知场景时,计算机没有办法预先知道图像中物体的尺度,因此我们需要同时考虑图像在多尺度下的描述,获知感兴趣物体的最佳尺度。图像的尺度空间表达指的是图像的所有尺度下的描述。
一、金字塔多分辨率
在早期计算机视觉领域中,金字塔是图像多尺度表示主要表达形式。
图像金字塔化一般包括两个步骤:
首先,图像经过一个低通滤波进行平滑。
然后,对这个平滑以后的图像进行抽样,从而得到一系列尺寸缩小的图像。
虽然金字塔化能够搞笑的对图像进行多尺度的表达,但它缺乏坚实的理论基础,不能分析图像中各种尺度。1983年,witkin提出信号的尺度空间表达就是通过一系列单参数、宽度递增的高斯滤波器将原始信号滤波得到一组低频信号。不同高斯核组成的尺度空间是规范和线型的,并且满足以下若干性质,即平移不变性、半群结构、非递增局部极值、尺度不变性和旋转不变性等。
高斯尺度空间及其性质
1、加权平均和有限孔径效应
信号某个点在尺度空间的表达可以看成是原始信号在空间上一系列加权平滑,权重就是具有不同尺度参数的高斯核,从另一个角度来看,加权平均也可以视为物理信号的观测孔径。信号在某个尺度t上的表达也就对应于一个无方向性的孔径函数来观测信号的结果。这时候信号中特征长度小于sigma的精细结构会被抑制。
2、层叠平滑
尺度空间表达另一个重要性子就是高斯核的半群性质:两个高斯核卷积等同于另外一个不同核参数的高斯核卷积
这就意味着粗尺度上的信号表达不但可以从原始信号和高斯核卷积直接得到,也可以从精细尺度的信号表达和高斯核卷积得到,这就是尺度空间的层叠平滑性质。
3、局部极值递减性
尺度空间表达具有强平滑特性,这也可以从局部极值的数量随尺度增大而递减的特性看出来。
(1)如果在某个尺度上,函数在某点取得局部极大值,则该点拉普拉斯运算时负值。
(2)如果在某个尺度上,函数在某点取得局部极小值,则该点拉普拉斯运算是正值。
在微积分中,一个函数的n阶导数极值点是其(n+1)阶导数的零点。所以,根据信号尺度空间的局部极值数量递减的性质,函数的各阶导数极值点数量不会增加,同样意味着零点数量也不会增加。
4、尺度伸缩不变性
二、多尺度和多分辨率
金字塔多分辨率表达和尺度空间之间最大的不同就是尺度空间表达式不同高斯核平滑卷积得到的,在所有尺度上具有相同的分辨率;而金字塔多分辨表达的每层分辨率都要减少固定比率。所以从计算效率和存储来看,金字塔多分辨率可以较快的生成,而多尺度表达随着尺度参数的增加冗余信息就变得更多。尺度空间表达一个重要的性质是信号局部结构可以用很简单形式在不同尺度上描述出来,而金字塔表达没有理论基础,难以对信号中局部结构进行分析。
三、自动尺度选择
尺度选择思路
尺度选择准则:在没有其他先验知识前提下,若某个规范化微分的组合在某个尺度下取得局部极值,则这个尺度可被视为信号中相应结构的特征尺度。
四、斑点检测
斑点检测是计算机视觉中的重要内容,它是区域检测中的一种特例、是许多特征生成、目标识别等方法的重要预处理环节。斑点检测通常是指与周围有着颜色和灰度差别的区域。由于斑点是一个区域,相比单纯的角点,它的稳定性要好。抗噪声能力强。作为局部特征中的一个重要特例,斑点在图像配准中和立体视觉中扮演了非常重要的角色。
LoG检测
利用高斯拉普拉斯LoG算子检测图像斑点是一种十分常用的方法。
规范化算子的三维图像和二维图像,是圆对称函数。图像与某一个函数卷积实际上就是求取与某一函数的相似性,同理,图像与高斯拉普拉斯函数的卷积就是求取图像与高斯拉普拉斯函数的相似性。当图像的斑点尺寸与高斯拉普拉斯函数的形状趋近一致时,此时,图像的拉普拉斯响应抵达最大。将拉普拉斯响应到达峰值时的尺度sigma值,称为特征尺度。计算图像在不同尺度下的离散拉普拉斯响应值,然后,检查未知空间中的每个点。如果该点的拉普拉斯响应值都大于霍小玉其他26个立方空间邻域值,那么该点就是被检测到的图像斑点。
DoH检测
另一种斑点检测的方法是利用图像点的二阶微分Hessain矩阵以及它的行列式值DoH。
与LoG一样,Hessian矩阵行列式值,同样反映了图像局部的结构信息,与LoG相比,DoH对图像中细长结构的斑点同样有较好的抑制作用。
无论是LoG还会DoH对图像斑点进行检测,其步骤都分为以下两步:
(1)使用不同的σ生成模板,并对图像进行卷积运算。
(2)在图像的位置空间和尺度空间中搜索LoG和DoH相应的峰值。
五、边缘检测
边缘检测是图像处理和计算机视觉中常用的算子,其目标是找到图像中亮度变化剧烈的像素点集。在现实世界中,对应于图像中亮度变化剧烈的情况主要有:
(1)深度的不连续(物体处在不同的物平面上);
(2)表面方向的不连续(如正方体的不同的两个面);
(3)物体材料不同(导致光的反射系数不同);
(4)场景中光照不同
在介绍边缘检测算子前,我们先介绍一下每个图像点的局部坐标系,这个坐标系不依赖于坐标系统的方向,具有旋转不变性。
局部坐标常见的一种选择就是在每个点上引进局部正交坐标系(u,v),v指向的是该点的梯度方向,u轴和v轴垂直。
在数学上,边缘指的是亮度梯度上达到最大值的图像点。
六、角点检测
在现实世界中,角点对应于物体的拐点。角点有两个版本的定义:一是角点可以是两个边缘的交点;二是角点邻域内具有两个主方向的特征点。
从二十世纪70年代开始,许多学者对角点检测投入了大量的研究:
(1)基于模板的交点检测算法;
(2)基于边缘特征的角点检测方法;
(3)基于亮度变化的角点检测方法;
角点首先在粗糙的尺度上被检测出来,在这个尺度上图像已经被平滑模糊了,检测到的角点位置在原图上会因此平滑而产生飘移变得不精确,所以角点检测完成后需要有定位的步骤。
角点定位算法
粗糙尺度上的角点定位具有更大范围的邻域点,而精细尺度上角点重定位时只需考虑相对小一些的邻域。
为了对定位的结果自动选择一个特征尺度,我们必须把最小化问题从单一尺度扩展到多尺度上去。