视觉SLAM研究现状

1. 按处理图片的方式区分:

1.1 特征点法

PTAM、ORB-SLAM为代表。

步骤:1)提取特征点;2)根据特征点对不同图片进行匹配;3)根据视觉几何约束求出运动;4)通过最小化重投影误差优化结果。

优点:1)可以在非常多的图片之间寻找到特征匹配。

缺点:1)依赖特征点的效果,各个阈值需要很精巧地设定。2)需要剔除误匹配。3)特征点的优化往往是为了提高速度,带来的牺牲是特征点的鲁棒性。

1.2 直接法

LSD-SLAM、DSO为代表。

特点:1)直接用像素点的灰度值进行运算。特征法只用了特征点之间的距离信息,而直接法用了梯度大小及方向。直接法几乎使用了图片所有的信息,即使是很小的梯度值,所以针对少特征点的场景、相机不聚焦、运动模糊的情况,直接法的表现要好于特征法。2)特征法是最小化重投影误差,而直接法是最小化光度学误差(photometric error)。光度学误差的计算量要大于重投影误差。但是直接法省去了计算特征点和描述子的时间。3)更方便建立半稠密地图。

1.3 半直接法

SVO为代表。Tracking线程的三步,前两步用直接法最小化photometric error匹配,第三步用特征点法最小化重投影误差优化。

2. 点云的稠密程度区分:

2.1 稀疏法

PTAM、ORB-SLAM为代表,一般是特征点法。

2.2 稠密法:

DTAM、KinectFusion为代表,一般用RGBD相机,计算量很大,需要GPU并行。

2.3 半稠密法

LSD-SLAM、DSO为代表,一般用直接法得到,因为直接法可以利用图像中所有灰度值梯度明显的区域,这比特征点法提取的特征要稠密一些。如果是用特征点法,比如ORB-SLAM,则需要在把稀疏地图稠密化。

3. 按计算方式区分:

3.1 滤波法

Mono-SLAM为代表。

3.2 优化法

PTAM开始的一系列SLAM算法都是用优化法,主要原因是基于优化的算法比滤波法在单位计算时间可以得到更高的精度(参考文献:Strasdat H, Montiel J M M, Davison A J. Real-time monocular SLAM: Why filter?[C]//Robotics and Automation (ICRA), 2010 IEEE International Conference on. IEEE, 2010: 2657-2664.)

优化工具:

1) g2o

2) gtsam

3) ceres-solver

4) isam2

4. 按相机类型区分

4.1 单目

尺度未知、尺度漂移是个问题,往往结合IMU确定尺度。

4.2 双目(多目)

结合单目和RGBD的优点,一方面保持了设备的简单化,另一方面可以恢复尺度。

4.3 RGBD

一般是稠密重建。

5. 是否IMU融合:

典型项目:

1) MSCKF

2) OKVIS

3) ROVIO

4) HKUST VINS

原文地址:https://www.cnblogs.com/zonghaochen/p/6907389.html

时间: 2024-10-10 09:26:51

视觉SLAM研究现状的相关文章

视觉SLAM漫谈 (三): 研究点介绍

1. 前言 读者朋友们大家好!(很久很久)之前,我们为大家介绍了SLAM的基本概念和方法.相信大家对SLAM,应该有了基本的认识.在忙完一堆写论文.博士开题的事情之后,我准备回来继续填坑:为大家介绍SLAM研究的方方面面.如果前两篇文章算是"初识",接下来几篇就是"渐入佳境"了.在第三篇中,我们要谈谈SLAM中的各个研究点,为研究生们(应该是博客的多数读者吧)作一个提纲挈领的摘要.然后,我们再就各个小问题,讲讲经典的算法与分类.我有耐心讲,你是否有耐心听呢? 在&l

视觉SLAM漫淡(二):图优化理论与g2o的使用

视觉SLAM漫谈(二):图优化理论与g2o的使用 1    前言以及回顾 各位朋友,自从上一篇<视觉SLAM漫谈>写成以来已经有一段时间了.我收到几位热心读者的邮件.有的希望我介绍一下当前视觉SLAM程序的实用程度,更多的人希望了解一下前文提到的g2o优化库.因此我另写一篇小文章来专门介绍这个新玩意. 在开始本篇文章正文以前,我们先来回顾一下图优化SLAM问题的提法.至于SLAM更基础的内容,例如SLAM是什么东西等等,请参见上一篇文章.我们直接进入较深层次的讨论.首先,关于我们要做的事情,你

视觉SLAM中的数学基础 第三篇 李群与李代数

视觉SLAM中的数学基础 第三篇 李群与李代数 前言 在SLAM中,除了表达3D旋转与位移之外,我们还要对它们进行估计,因为SLAM整个过程就是在不断地估计机器人的位姿与地图.为了做这件事,需要对变换矩阵进行插值.求导.迭代等操作.例如,在经典ICP问题中,给定了两组3D点,我们要计算它们之间的变换矩阵.假设第一组的3D点为$\mathbf{P}=\{ \mathbf{p}_i | i = [1,2, \ldots, N] \}$,第二组3D点为$\mathbf{Q}=\{ \mathbf{q}

经典视觉SLAM框架

引言:通过前面的推送我们已经对SLAM有了个大体的认识.(初识视觉SLAM)下面来看经典的视觉SLAM框架,了解一下视觉SLAM究竟由哪几个模块组成.本文选自<视觉SLAM十四讲:从理论到实践>. 整体视觉SLAM流程图. 整个视觉SLAM流程包括以下步骤. 传感器信息读取.在视觉SLAM中主要为相机图像信息的读取和预处理.如果是在机器人中,还可能有码盘.惯性传感器等信息的读取和同步. 视觉里程计(Visual Odometry,VO).视觉里程计的任务是估算相邻图像间相机的运动,以及局部地图

基于无线信号的手势识别研究现状调查

摘要:进入21世纪以来,人机交互技术持续发展,手势识别是代表之一.2013年,华盛顿大学的研究人员提出了使用无线信号进行手势识别的方法,给传统的手势识别技术带来的一定的挑战,但是这一技术并不是很成熟,暂时没有投入商业使用.本文详细介绍了手势识别,并叙述了基于无线射频的手势识别的研究现状. 关键词:无线信号.手势识别.人机交互 一.背景 进入二十一世纪以来,随着世界科技持续不断的进步以及计算机突飞猛进的发展和普及,人机交互技术(Human-Computer Interaction,简称HCI)在世

视觉slam学习之路(一)看高翔十四讲所遇到的问题

目前实验室做机器人,主要分三个方向,定位导航,建图,图像识别,之前做的也是做了下Qt上位机,后面又弄红外识别,因为这学期上课也没怎么花时间在项目,然后导师让我们确定一个方向来,便于以后发论文什么.上个礼拜看了些论文,感觉视觉slam方向还可以,图像识别毕竟不是计算机科班,可能真正要弄也很难有成果,slam也是最近才研究起来,也挺适合我们搞,需要一些高数.c++.ros等知识,学的东西也挺多的,但这样才能体现研究生的价值,不然本科生也能做,然后确定了这个研究方向,希望好好研究个一两年有所成就,研三

视觉SLAM中李群李代数与四元数总结

在SLAM中经常会用到李群李代数与四元数来表示旋转变换,这些数学公式往往需要推导来推导去,分分钟搞到头都大了.但在SLAM中往往用到其中那么几个固定的性质,所以是没有必要对这些数学基础作过多深入的研究,只需要记住其中一些常用的公式及性质即可.因此,本人在这里对这些数学基础作一个简单的总结,以便日后在工程中使用. 旋转的表示方式 SLAM中,往往会使用三种方式来表达空间中的旋转变换,分别为:旋转向量.旋转矩阵.四元数. 旋转向量 旋转向量可以非常直观地表示空间中的一个旋转变换:假设空间中有一单位向

基于三维GIS技术的矢量地图动态LOD渲染方法研究现状

“地图是人类文化的杰作,它融科学.艺术于一体,作为描述.研究人类生存环境的一种信息载体是人类生产与生活中不可缺少的一种工具.”这是陈述彭院士为<中国地图学年鉴>作序的开场语.Taylor也曾指出“当涉及应用人脑来识别空间联系中的模式与相互关系时,地图学的认知方法是唯一的过程”.地图存在于我们生活的方方面面,应用广泛且己经产生了巨大的社会效应和经济效益,其重要性不言而喻.地图是地图可视化的结果,地图可视化作为现代地图学的核心一直是三维GIS的研究热点.地图可视化将电子设备的视觉传输能力和人类的视

NLP+语篇分析(五)︱中文语篇分析研究现状(CIPS2016)

摘录自:CIPS2016 中文信息处理报告<第三章 语篇分析研究进展.现状及趋势>P21 CIPS2016 中文信息处理报告下载链接:http://cips-upload.bj.bcebos.com/cips2016.pdf NLP词法.句法.语义.语篇综合系列: NLP+词法系列(一)︱中文分词技术小结.几大分词引擎的介绍与比较 NLP+词法系列(二)︱中文分词技术及词性标注研究现状(CIPS2016) NLP+句法结构(三)︱中文句法结构研究现状(CIPS2016) NLP+语义分析(四)