图像融合算法(归纳篇)

综合关注几篇的papers的图像融合算法,对整个过程作归纳,与大家分享(^_^)。基于sift特征的全景拼接方法的整个过程的大致流程:

  1. 对需拼接的图像进行预处理,主要是几何校正和消噪。对于几何校正,因为我们考虑的是视频的实时处理,那么我们只需考虑摄像机的所有运动形式,其中包含8个自由度,可用投影变换来表示。H=[m0 m1 m2;m3 m4 m5;m6 m7 1],考虑到它的算法复杂度已经有n的3次方,我们可以考虑通过控制摄像机的运动方式来减少复杂度,比如令摄像机只有平移旋转和缩放,即仿射变换,降低了一次复杂度。消噪的话考虑到DOG本身就是一种很好的带通滤波器,这一步省略。
  2. 提取图像SIFT特征点描述算子。由于高斯函数是唯一可能的尺度空间核函数,所以整个SIFT算法是基于“尺度不变”的特征。
    • 对于二维图像的尺度空间L(X,Y,σ), 水平方向和垂直方向与滤波器(高通,低通)相卷积,从而得到G(X,Y,σ),即尺度可变高斯函数。
    • 而DOG是不同尺度的高斯差分核和图像卷积而成[注]。DOG的方式相当于一个人从远和近两个不同的地方看景物,它的边缘是不会很大有变化的。由于它的边缘效应很强,所以会加强很多高频随机噪声。这时候需要去除不符条件的算子,通过拟合三维二次函数的得到一个理论的极值点函数,这时候需要设定一个比例,大于这个比例的点剔除。剔除之后要把特征点生成人眼适应的描述算子。
    • 由于为了要让算子具备旋转不变性,我们在以特征点为中心的领域窗口采样,并用直方图统计邻域像素的梯度方向。10度一柱,直方图的峰值代表特征点处邻域梯度的主方向,即该特征点的主方向。为了增强系统的鲁棒性,当存在另一个相当于主峰值80%能量的峰值时,则将这个方向认为是该特征点的辅方向。然后将区域内所有点的梯度方向转过一个上述确定的主方向的角度(以确保旋转不变性)。
    • 然后将区域分为4*4=16个正方形子区域,每个区域中的点按梯度大小和正态分布加权,绘制出8个方向的直方图,所以每个特征点可得到一个128维的描述子向量,然后继续将特征向量的长度归一化,去除光照变化的影响。
  3. 进行特征匹配,得到特征匹配对。以前都是采用Kd-Tree算法,我们在这里使用近似最近邻算法,即BBF算法。该方法采用一个优先级队列使搜索一次从节点与被查询节点距离由近及远的顺序进行。(BBF算法更适合维度高的特征向量,而SIFT特征是128维向量,较为实用)
  4. 匹配提取,得到鲁棒的特征匹配对。由于只采用RANSAC算法可能会导致鬼影现象,所以需要改进RANSAC算法,以RANSAC确定的配准误差阀值的90%作为配准阀值提取最终的仿射变换矩阵,增强鲁棒性。
  5. 进行图像融合。由于图像融合是为了视频做准备,实时性要求很高,所以复杂度高的算法在这里不适用。
    • 在关注几篇论文里面都是采用线性融合算法对重合区域使用双线性插值,一般是渐入渐出的加权平均算法,这样虽然可以较快获得图像,但是重合部分较多时会造成耗时变长,重合区域会非常模糊,且图中若出现新物体时会让它的亮度大大降低。考虑到图像清晰度和实时性两点,以及这项技术如果实现得到应用之后的应用性,
    • 中值滤波比较适合。主要思想是利用中值滤波器来解决重合部分像素值的突变。用直观的方式来解释的话就是利用中值滤波去除高于某个阀值的点,消除像素值的突变,保持光强连续性。中值滤波法的好处在于可以增强细节,保持较高频的图像信息,特别是突出变化目标,这非常实用。
    • 如果我们能够改进中值滤波法,降低它在GPU上的运行时间,那它就可以作为一种最适合的方式。 还有就是关于消除拼接图像的鬼影效果,目前,考虑到我们采用的图像融合办法出现鬼影的概率不是很高,所以可以选择最简单的Collage算法。Collage算法好比拼贴画用特定图像覆盖重叠区域来形成图像,优点是简单迅速,但容易出现断层。所以需要用Seam cost function标准来评价,来提高拼接效果。

[注]2006年Michael Grabner简化了DOG算子,减少了运算量。DOG算子的优点在于它有很强的移植性和普适性。当K设为1.6时,即为高斯拉普拉斯算子的近似。而在DOG算法中,它是一种模拟视网膜上的神经从影像中提取信息从而提供给大脑,这是K约等于为5.

关于Image Engineering& Computer Vision更多讨论与交流,敬请关注本博客和新浪微博songzi_tea.

图像融合算法(归纳篇),布布扣,bubuko.com

时间: 2024-11-03 03:38:58

图像融合算法(归纳篇)的相关文章

图像融合算法(感应篇)

复按照几个papers图像融合算法,诱导整个过程,与您分享(^_^). 基于sift的全景拼接方法的整个过程的大致流程: 对需拼接的图像进行预处理.主要是几何校正和消噪.对于几何校正.因为我们考虑的是视频的实时处理,那么我们仅仅需考虑摄像机的全部运动形式,当中包括8个自由度.可用投影变换来表示.H=[m0 m1 m2;m3 m4 m5;m6 m7 1],考虑到它的算法复杂度已经有n的3次方.我们能够考虑通过控制摄像机的运动方式来减少复杂度,比方令摄像机仅仅有平移旋转和缩放,即仿射变换,减少了一次

图像融合(一)-- 概述

这是2014年第二部分的内容.关于三光检测融合的一些资料整理,部分内容由于保密原因没有写出来,这里整理的内容都是网上或者文章里可以看到的. 一.概述 图像融合是图像处理中重要部分,能够协同利用同一场景的多种传感器图像信息,输出一幅更适合于人类视觉感知或计算机进一步处理与分析的融合图像.它可明显的改善单一传感器的不足,提高结果图像的清晰度及信息包含量,有利于更为准确.更为可靠.更为全面地获取目标或场景的信息. 图像融合主要应用于军事国防上.遥感方面.医学图像处理.机器人.安全和监控.生物监测等领域

图像融合(四)-- 对比度金字塔

对比度金字塔融合 在考虑人类视觉系统对局部对比度敏感这一视觉特性的基础上,提出了基于对比度金字塔(Contrast Pyramid,CP)分解的图像融合算法.CP 分解类似于 LP 分解,但它的每一层图像是高斯金字塔相邻两层图像的比率. CP 融合算法应用于合成孔径雷达和前视红外图像融合. 1.原理阐述 ?   (1)得到高斯金字塔(如上篇) (2)对比度金字塔 用高斯金字塔得到上采样并高斯卷积之后的预测图像*Gl,*Gl的尺寸和Cl-1相同,即经过放大算子的处理(pyrup).图像的对比度通常

图像融合(五)-- 梯度金字塔

基于梯度金字塔(Gradient Pyramid,GP)分解的图像融合算法.GP 也是一种基于高斯金字塔的多尺度分解算法.通过对高斯金字塔每层图像进行梯度算子运算,便可获得图像的 GP表示.GP 每层分解图像都包含水平.垂直和两个对角线四个方向的细节信息,能更好地提取出图像的边缘信息,提高了稳定性和抗噪性.具有方向性的梯度塔形分解能够很好地提供图像的方向边缘和细节信息. 1.原理阐述 (1)得到高斯金字塔(如上) (2)对图像高斯金字塔的各分解层(最高层除外)分别进行梯度方向滤波,便可得到梯度塔

从泊松方程的解法,聊到泊松图像融合

从泊松方程的解法,聊到泊松图像融合 成指导 ? 字节跳动 算法工程师 283 人赞同了该文章 2004 年 SIGGRAPH 上,Microsoft Research UK 有篇经典的图像融合文章<Poisson Image Editing>.先看看其惊人的融合结果(非论文配图,本人实验结果): 这篇文章的实现,无关目前算法领域大火的神经网络,而是基于泊松方程推导得出. 泊松方程是什么? 很多朋友比较熟悉概率论里面的泊松分布.泊松方程,也是同一个数学家泊松发明的.但却和泊松分布没有什么关系,是

梯度、散度和旋度及在图像处理中的应用(图像融合)

 对于有些人,看这些枯燥的公式符号是件痛苦的事情:但痛苦后总会有所欣喜,如果你充分利用它的话,你更能体会到他的美妙:先来几张效果图,激发你学习数学的欲望: 注释:图像融合效果,分别应用了不同的算法 在图像图形处理中, 梯度.散度和旋度 有很重要的作用,比如图像修复中的解泊松方程,目标跟踪等等,可以说是他们无处不在. 来句废话:可能有些人,对于数学符号里面倒三角 正三角 符号的意思?与读法感到迷惑,现稍作解释: △二次函数根的判别式或者指三角形 ▽读Nabla,奈不拉,也可以读作"Del&qu

融合算法集锦

一.PCA: PCA是一种用来对图像特征降维的方法,PCA通过将多个变量通过线性变换以选出较少的重要变量.它往往可以有效地从过于"丰富"的数据信息中获取最重要的元素和结构,去除数据的噪音和冗余,将原来复杂的数据降维,揭示隐藏在复杂数据背后的简单结构.近年来,PCA方法被广泛地运用于计算机领域,如数据降维.图像有损压缩.特征追踪等等.PCA方法是一个高普适用方法,它的一大优点是能够对数据进行降维处理,我们通过PCA方法求出数据集的主元,选取最重要的部分,将其余的维数省去,从而达到降维和简

图像缩放算法【转】

转自:http://blog.csdn.net/qq_21792169/article/details/51020005 版权声明:本文为Linux_Google原创文章,转载请加上原创链接. 转载别人的,但是这篇文章写得确实太好了,所以想分享出来,可是原创文章地址找不到了 ,很可惜. 图像缩放算法 摘要:首先给出一个基本的图像缩放算法,然后一步一步的优化其速度和缩放质量: 高质量的快速的图像缩放 全文 分为:      上篇 近邻取样插值和其速度优化      中篇 二次线性插值和三次卷积插值

图像融合(六)-- 小波融合

基于小波的融合(wavelet) 小波变换的固有特性使其在图像处理中有如下优点:完善的重构能力,保证信号在分解过程中没有信息损失和冗余信息:把图像分解成平均图像和细节图像的组合,分别代表了图像的不同结构,因此容易提取原始图像的结构信息和细节信息:小波分析提供了与人类视觉系统方向相吻合的选择性图像. 离散小波变换(Discrete Wavelet Transform, DWT).DWT的函数基由一个称为母小波或分析小波的单一函数通过膨胀和平移获得.因而,DWT同时具有时域和频域分析能力,与一般的金