图像空间尺度理论

对现实中物体的描述一定要在一个十分重要的前提下进行,这个前提就是对自然界建模时的尺度。当用一个机器视觉系统分析未知场景时,计算机没有办法预先知道图像中物体的尺度,因此我们需要同时考虑图像在多尺度下的描述,获知感兴趣物体的最佳尺度。图像的尺度空间表达指的是图像的所有尺度下的描述。

一、金字塔多分辨率

在早期计算机视觉领域中,金字塔是图像多尺度表示主要表达形式。

图像金字塔化一般包括两个步骤:

首先,图像经过一个低通滤波进行平滑。

然后,对这个平滑以后的图像进行抽样,从而得到一系列尺寸缩小的图像。

虽然金字塔化能够搞笑的对图像进行多尺度的表达,但它缺乏坚实的理论基础,不能分析图像中各种尺度。1983年,witkin提出信号的尺度空间表达就是通过一系列单参数、宽度递增的高斯滤波器将原始信号滤波得到一组低频信号。不同高斯核组成的尺度空间是规范和线型的,并且满足以下若干性质,即平移不变性、半群结构、非递增局部极值、尺度不变性和旋转不变性等。

高斯尺度空间及其性质

1、加权平均和有限孔径效应

信号某个点在尺度空间的表达可以看成是原始信号在空间上一系列加权平滑,权重就是具有不同尺度参数的高斯核,从另一个角度来看,加权平均也可以视为物理信号的观测孔径。信号在某个尺度t上的表达也就对应于一个无方向性的孔径函数来观测信号的结果。这时候信号中特征长度小于sigma的精细结构会被抑制。

2、层叠平滑

尺度空间表达另一个重要性子就是高斯核的半群性质:两个高斯核卷积等同于另外一个不同核参数的高斯核卷积

这就意味着粗尺度上的信号表达不但可以从原始信号和高斯核卷积直接得到,也可以从精细尺度的信号表达和高斯核卷积得到,这就是尺度空间的层叠平滑性质。

3、局部极值递减性

尺度空间表达具有强平滑特性,这也可以从局部极值的数量随尺度增大而递减的特性看出来。

(1)如果在某个尺度上,函数在某点取得局部极大值,则该点拉普拉斯运算时负值。

(2)如果在某个尺度上,函数在某点取得局部极小值,则该点拉普拉斯运算是正值。

在微积分中,一个函数的n阶导数极值点是其(n+1)阶导数的零点。所以,根据信号尺度空间的局部极值数量递减的性质,函数的各阶导数极值点数量不会增加,同样意味着零点数量也不会增加。

4、尺度伸缩不变性

二、多尺度和多分辨率

金字塔多分辨率表达和尺度空间之间最大的不同就是尺度空间表达式不同高斯核平滑卷积得到的,在所有尺度上具有相同的分辨率;而金字塔多分辨表达的每层分辨率都要减少固定比率。所以从计算效率和存储来看,金字塔多分辨率可以较快的生成,而多尺度表达随着尺度参数的增加冗余信息就变得更多。尺度空间表达一个重要的性质是信号局部结构可以用很简单形式在不同尺度上描述出来,而金字塔表达没有理论基础,难以对信号中局部结构进行分析。

三、自动尺度选择

尺度选择思路

尺度选择准则:在没有其他先验知识前提下,若某个规范化微分的组合在某个尺度下取得局部极值,则这个尺度可被视为信号中相应结构的特征尺度。

四、斑点检测

斑点检测是计算机视觉中的重要内容,它是区域检测中的一种特例、是许多特征生成、目标识别等方法的重要预处理环节。斑点检测通常是指与周围有着颜色和灰度差别的区域。由于斑点是一个区域,相比单纯的角点,它的稳定性要好。抗噪声能力强。作为局部特征中的一个重要特例,斑点在图像配准中和立体视觉中扮演了非常重要的角色。

LoG检测

利用高斯拉普拉斯LoG算子检测图像斑点是一种十分常用的方法。

规范化算子的三维图像和二维图像,是圆对称函数。图像与某一个函数卷积实际上就是求取与某一函数的相似性,同理,图像与高斯拉普拉斯函数的卷积就是求取图像与高斯拉普拉斯函数的相似性。当图像的斑点尺寸与高斯拉普拉斯函数的形状趋近一致时,此时,图像的拉普拉斯响应抵达最大。将拉普拉斯响应到达峰值时的尺度sigma值,称为特征尺度。计算图像在不同尺度下的离散拉普拉斯响应值,然后,检查未知空间中的每个点。如果该点的拉普拉斯响应值都大于霍小玉其他26个立方空间邻域值,那么该点就是被检测到的图像斑点。

DoH检测

另一种斑点检测的方法是利用图像点的二阶微分Hessain矩阵以及它的行列式值DoH。

与LoG一样,Hessian矩阵行列式值,同样反映了图像局部的结构信息,与LoG相比,DoH对图像中细长结构的斑点同样有较好的抑制作用。

无论是LoG还会DoH对图像斑点进行检测,其步骤都分为以下两步:
(1)使用不同的σ生成模板,并对图像进行卷积运算。

(2)在图像的位置空间和尺度空间中搜索LoG和DoH相应的峰值。

五、边缘检测

边缘检测是图像处理和计算机视觉中常用的算子,其目标是找到图像中亮度变化剧烈的像素点集。在现实世界中,对应于图像中亮度变化剧烈的情况主要有:

(1)深度的不连续(物体处在不同的物平面上);

(2)表面方向的不连续(如正方体的不同的两个面);

(3)物体材料不同(导致光的反射系数不同);

(4)场景中光照不同

在介绍边缘检测算子前,我们先介绍一下每个图像点的局部坐标系,这个坐标系不依赖于坐标系统的方向,具有旋转不变性。

局部坐标常见的一种选择就是在每个点上引进局部正交坐标系(u,v),v指向的是该点的梯度方向,u轴和v轴垂直。

在数学上,边缘指的是亮度梯度上达到最大值的图像点。

六、角点检测

在现实世界中,角点对应于物体的拐点。角点有两个版本的定义:一是角点可以是两个边缘的交点;二是角点邻域内具有两个主方向的特征点。

从二十世纪70年代开始,许多学者对角点检测投入了大量的研究:

(1)基于模板的交点检测算法;

(2)基于边缘特征的角点检测方法;

(3)基于亮度变化的角点检测方法;

角点首先在粗糙的尺度上被检测出来,在这个尺度上图像已经被平滑模糊了,检测到的角点位置在原图上会因此平滑而产生飘移变得不精确,所以角点检测完成后需要有定位的步骤。

角点定位算法

粗糙尺度上的角点定位具有更大范围的邻域点,而精细尺度上角点重定位时只需考虑相对小一些的邻域。

为了对定位的结果自动选择一个特征尺度,我们必须把最小化问题从单一尺度扩展到多尺度上去。

图像空间尺度理论,布布扣,bubuko.com

时间: 2024-10-13 14:06:24

图像空间尺度理论的相关文章

局部不变特征与尺度空间理论

局部不变特征与尺度空间理论 局部不变性:尺度不变性与旋转不变性. 尺度不变性:人类在识别一个物体时,不管这个物体或远或近,都能对它进行正确的辨认,这就是所谓的尺度不变性. 尺度空间理论经常与生物视觉关联,有人也称图像局部不变性特征为基于生物视觉的不变性方法. 旋转不变性:当这个物体发生旋转时,我们照样可以正确地辨认它,这就是所谓的旋转不变性. 一.局部不变特征 全局特征:从整个图像中抽取的特征.较多的运用在图像检索领域,如图像颜色直方图. 局部特征:从图像的局部区域中抽取的特征,而这个局部区域往

《我的十年图像生涯》—王郑耀(西安交通大学)

最近看王郑耀的<我的十年图像生涯>颇有感悟,在此把他的资料总结下 参考: 1.王郑耀<我的十年图像生涯>博客 链接——https://www.cnblogs.com/jsxyhelu/p/7054573.html 里边有自己这十年的经历: 2.王郑耀<数字图像的边缘检测>本科论文 链接——https://max.book118.com/html/2014/1119/10370798.shtm 里边是他自己本科毕设做的方向,主要总结有15种边缘检测算子: 3.王郑耀<

OpenCV3入门(六)图像滤波

1.图像滤波理论 1.1图像滤波理论 图像滤波即在尽量保留图像细节特征的条件下对目标图像的噪声进行抑制,是图像预处理中不可缺少的操作.消除图像中的噪声又叫做图像滤波或平滑,滤波的目的有两个,一是突出特征以方便处理,二是抑制噪声. 空间域滤波就是在图像平面上对像素进行操作.空间域滤波大体分为两类:平滑.锐化. 平滑滤波:模糊处理,用于减小噪声,实际上是低通滤波,典型的滤波器是高斯滤波. 锐化滤波:提取边缘突出边缘及细节.弥补平滑滤波造成的边缘模糊.实际上是高通滤波. 空间域处理可由下式表示: g(

OpenCV_Tutorials——CORE MODULE.THE CORE FUNCTIONALITY——Adding (blending) two images using OpenCV

目标 在教程中你会学到: 1.什么事线性混合,它有什么用. 2.如何使用addWeighted将两个图像相加 理论 注意:下面的解释来自Richard Szeliski写的<Computer Vision:Algorithms and Application>. 在前面的教程中,我们已经学习了一些像素的运算.一个有意思的二元(两个输入)运算符就是线性混合运算符: 通过α从0到1变化这个运算符可以被用做两个图像或者录像之间的时间交融(cross-dissolve,这里tutorial里面用的是c

图像处理与机器视觉行业分析

图像处理与机器视觉 一 行业分析 数字图像处理是对图像进行分析.加工.和处理,使其满足视觉.心理以及其他要求的技术.图像处理是信号处理在图像域上的一个应用.目前大多数的图像是以数字形式 存储,因而图像处理很多情况下指数字图像处理.此外,基于光学理论的处理方法依然占有重要的地位. 数字图像处理是信号处理的子类, 另外与计算机科学.人工智能等领域也有密切的关系. 传统的一维信号处理的方法和概念很多仍然可以直接应用在图像处理上,比如降噪.量化等.然而,图像属于二维信号,和一维信号相比,它有自己特殊的一

图像处理学习过程——网站,视频,书籍(长期更新)

网站: http://www.linuxgraphics.cn/home/index.html 图像处理编程相关的网站,也讲到了一些基础知识.特点是比较全,关于图形处理各方面的知识都有涉及到,但是比较粗浅.可以从这里延伸深入研究某个领域. http://pippin.gimp.org/image_processing/ 图像处理位图和矢量图相关基础知识介绍,英文网站,决定以翻译的形式放到博客中来. 视频: http://v.163.com/special/opencourse/daishu.ht

同源策略与跨域技术

待整理:1-2参见<JavaScript高级程序设计>P586;3-5参见http://mp.weixin.qq.com/s/asmzA8a1HuYQxyx8K0q-9g 一.同源策略 https://developer.mozilla.org/zh-CN/docs/Web/Security/Same-origin_policy 浏览器的同源策略限制了 从一个源加载的文档或脚本与来自另一个源的资源的交互.它是隔离潜在恶意文档的关键安全机制. 具体限制: 不能通过ajax的方法去请求不同源的资源

BMP 图像信息隐藏及检测

原理简介 针对文件结构的信息隐藏方法需详细掌握文件的格式,利用文件结构块之间的关系或根据块数据和块大小之间的关系来隐藏信息. BMP(Bitmap-File)图形文件是 Windows 采用的常见图形文件格式,要利用 BMP 位图进行信息隐藏首先需要详细了解 BMP 文件的格式,BMP 图像文件结构比较单一而且固定,BMP  图像由文件头.信息头.调色板区和数据区四个部分组成,而 24 位真彩色图像中没有调色板信息.24 位真彩色 BMP 位图文件包括 3 部分. 第一部分是 BMP 文件头(1

图像增强之空间域锐化

1.图像锐化理论 图像锐化的目的是使图像变得清晰起来,锐化主要用于增强图像的灰度跳变部分,这一点与图像平滑对灰度跳变的抑制正好相反.锐化提高图像的高频分量,增加灰度反差增强图像的边缘和轮廓,以便后期图像识别. 在图像增强过程中,常用平滑算法来消除噪声,平滑属于低通滤波,图像的能量主要集中在低频部分,噪声所在频段主要在高频部分,同时图像的边缘也集中在高频部分,这意味着图像平滑后,高频被衰减轮廓会出现模糊.图像锐化就是为了减少这种现象,通过高通滤波使图像边缘和轮廓变得清晰. 2.一阶微分图像增强--