基于ORB-SLAM2的图片识别

基于ORB-SLAM2的图片识别，其功能是首先运行ORB-SLAM2，在运行过程中调起另一个线程进行图像识别，识别成功后在图片上渲染AR中的立方体模型。

　　识别过程主要基于ORB-SLAM2中的BoW算法，同样使用DBoW2库和ORB特征以及词汇树视觉词典。其主要流程可以概括为：运行ORB-SLAM2，加载ORB词典，然后读取训练图像进行BoW训练，完成之后就是SLAM的过程了，使用Pangolin做的UI界面，开启图像识别之后，线程会取当前帧和训练图像做BoW向量的相似性打分，我的策略是当当前帧和某一图像的相似性得分大于某个得分时（0.015左右），就认为当前帧和该图相似，然后再进行特征匹配，同时使用正向索引加速匹配过程，如果同时匹配上的特征大于某个阈值（nmatches），则认为这两幅图像的确是相似的，则选中匹配上的3D特征点，利用这些特征点进行Delaunay三角剖分进行三角网格的绘制，同时绘制虚拟立方体在匹配3D特征点的均值位置上，效果还可以。

　　同时在这个里面继承了原来的平面检测模块，但是缩小了平面检测的范围，主要方法是在当前帧图像上截取一个1/2~2/3的矩形框，将矩形框内的3D点以及特征点等信息作为检测平面的依据，这样可以将举行框对准一小块儿平面区域进行检测，准确率较高，效果较好。

　　效果附图：mark

　　程序文件：略。

时间： 2024-09-30 18:44:51

基于ORB-SLAM2的图片识别的相关文章

【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇四：关于OneNote入库处理以及审核

篇一:WPF常用知识以及本项目设计总结:http://www.cnblogs.com/baiboy/p/wpf.html 篇二:基于OneNote难点突破和批量识别:http://www.cnblogs.com/baiboy/p/wpf1.html 篇三:批量处理后的txt文件入库处理:http://www.cnblogs.com/baiboy/p/wpf2.html 篇四:关于OneNote入库处理以及审核:http://www.cnblogs.com/baiboy/p/wpf3.html [

【基于WPF+OneNote+Oracle的中文图片识别系统阶段总结】之篇三：批量处理后的txt文件入库处理

篇一:WPF常用知识以及本项目设计总结:http://www.cnblogs.com/baiboy/p/wpf.html 篇二:基于OneNote难点突破和批量识别:http://www.cnblogs.com/baiboy/p/wpf1.html 篇三:批量处理后的txt文件入库处理:http://www.cnblogs.com/baiboy/p/wpf2.html 篇四:关于OneNote入库处理以及审核:http://www.cnblogs.com/baiboy/p/wpf3.html [

基于图片识别服务的IOS图片识别程序

由于TensorFlow提供的IOS版Demo相对于Android版识别率不高,所以开发了通过识别服务进行图片识别的IOS版程序. 该程序基于图片识别服务(http://www.cnblogs.com/conorpai/p/6873650.html),将拍照或图库中的图片上传至识别服务,获取返回结果并显示代码位置:https://github.com/ConorPai/PlantRecognitionByWebAPI 效果图片:

ECG信号读取，检测QRS，P，T 波（基于小波去噪与检测），基于BP神经网络的身份识别

这学期选了神经网络的课程,最后作业是处理ECG信号,并利用神经网络进行识别. 1 ECG介绍与读取ECG信号 1)ECG介绍具体ECG背景应用就不介绍了,大家可以参考百度谷歌.只是简单说下ECG的结构: 一个完整周期的ECG信号有 QRS P T 波组成,不同的人对应不用的波形,同一个人在不同的阶段波形也不同.我们需要根据各个波形的特点,提取出相应的特征,对不同的人进行身份识别. 2)ECG信号读取首先需要到MIT-BIH数据库中下载ECG信号,具体的下载地址与程序读取内容介绍可以参考

基于HTML Canvas实现“指纹识别”技术

作者:zhanhailiang 日期:2015-01-31 说明所谓指纹识别是指为每个设备标识唯一标识符(以下简称UUID).诸如移动原生的APP都可以通过调用相关设备API来获取相应的UUID.但是浏览器内WebAPP受限于运行环境无法直接防部设备API,此时需要通过其它方法来设置UUID. 基于持久化Cookie生成UUID 原理当用户访问一个网站时,网站可以在用户当前的浏览器Cookie中种入含有UUID的Cookie,并通过这个信息将用户所有行为(浏览了哪些页面?搜索了哪些关键字?对

基于Deep Learning 的视频识别方法概览

深度学习在最近十来年特别火,几乎是带动AI浪潮的最大贡献者.互联网视频在最近几年也特别火,短视频.视频直播等各种新型UGC模式牢牢抓住了用户的消费心里,成为互联网吸金的又一利器.当这两个火碰在一起,会产生什么样的化学反应呢? 不说具体的技术,先上一张福利图,该图展示了机器对一个视频的认知效果.其总红色的字表示objects, 蓝色的字表示scenes,绿色的字表示activities. 图1 人工智能在视频上的应用主要一个课题是视频理解,努力解决"语义鸿沟"的问题,其中包括了:

基于Tesseract OCR的文字识别Android应用开发资料整理

前言一.Tesseract OCR引擎 Tesseract OCR是HP公司于1985~1995年间开发的商业级OCR(Optical Character Reader, 光学字符阅读器)引擎,并于2005年开放源代码.以下是它sourceforge上的网址: http://sourceforge.net/projects/tesseract-ocr/?source=directory 现在已转移到谷歌的代码服务下: https://code.google.com/p/tesseract-oc

Java基于opencv实现图像数字识别(一)

Java基于opencv实现图像数字识别(一) 最近分到了一个任务,要做数字识别,我分配到的任务是把数字一个个的分开:当时一脸懵逼,直接百度java如何分割图片中的数字,然后就百度到了用BufferedImage这个类进行操作:尝试着做了一下,做到灰度化,和二值化就做不下去了:然后几乎就没有啥java的资料了,最多的好像都是c++,惹不起.惹不起...... 我也想尝试着用c++做一下,百度到了c++基于opencv来做图像识别的:但是要下vs啊,十几个g呢,我内存这么小,配置这么麻烦,而且vs

Java基于opencv实现图像数字识别(二)—基本流程

Java基于opencv实现图像数字识别(二)-基本流程做一个项目之前呢,我们应该有一个总体把握,或者是进度条:来一步步的督促着我们来完成这个项目,在我们正式开始前呢,我们先讨论下流程. 我做的主要是表格中数字的识别,但这个不是重点.重点是通过这个我们可以举一反三,来实现我们自己的业务. 图像的识别主要分为两步:图片预处理和图像识别:这两步都很重要图像预处理: 1. 图像灰度化:二值化 2. 图像降噪,去除干扰线 3. 图像腐蚀.膨胀处理 4. 字符分割 5. 字符归一化图像识别: 1.

猜你喜欢

我所知道的数据库7-DDL语言（续2）

昨天写到单表的创建,创建带有约束的表单,其实约束也可以在后续添加或者修改的.语法格式是: ALTER TABLE 表名 ADD (CONSTRAINT 约束名约束类型(约束字段)); 例:CREAT ...

最小周长

基准时间限制:1 秒空间限制:131072 KB 分值: 5 难度:1级算法题一个矩形的面积为S,已知该矩形的边长都是整数,求所有满足条件的矩形中,周长的最小值.例如:S = 24,那么有{1 2 ...

杭电1272 并查集找环+判断连通

杭电1272 并查集找环+判断连通 E - E Time Limit:1000MS Memory Limit:32768KB 64bit IO Format:%I64d & % ...

Windows下也可以使用osw追朔系统历史性能

1.Windows系统历史性能分析困难背景在Linux/Unix上,要追朔历史性能,一般采用部署nmon进行性能监控采集与存储的方式实现,但是却没有在Windows上的版本. Windows系统如果 ...

centos7 python 中文 “UnicodeDecodeError: 'ascii' codec can't decode byte...”解决方法

UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0: ordinal not in range(128) 1. ...

Lesson with ServiceContractAttribute.ConfigurationName in the proxy class

使用SvcUtil工具可以生成一个cs文件,用以提供访问WCF服务要用到的代理类和接口. By utilizing SvcUtil tool, one can get the .cs file in ...

java学习笔记线程同步

在实现Runnable接口后,可以通过多个start方法来调用同一段代码资源,这也会导致一个问题就是资源可能不同步. 解决资源不同步的方法是,在同一时间段内,只允许一个线程来操作这个对象或方法,其他线 ...

[转]intent 传递对象

---恢复内容开始--- Activity之间通过Intent传递值,支持基本数据类型和String对象及它们的数组对象byte.byte[].char.char[].boolean.boolean[ ...

【web安全】第五弹：burpsuite proxy模块的一些理解

作为一只小小小白的安全新手,只会简单的用sqlmap扫扫网站,用burpsuite的proxy模块拦截一些请求.最近又对proxy有点儿小理解,记录之. 1. 查看sqlmap注入的语句以及HTTP ...

数组对象

<!DOCTYPE html><html xmlns="http://www.w3.org/1999/xhtml"><head><meta ...

LeetCode Intersection of Two Arrays

原题链接在这里:https://leetcode.com/problems/intersection-of-two-arrays/ 题目: Given two arrays, write a func ...

如何实现不确定宽高的盒子上下左右居中

图片素材: <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF ...

Windows xp 下删除ubuntu分区后恢复

1. 发生情形在windows下的计算机管理中删除了一个ubuntu10.04所在分区,结果所有Linux分区变成一片绿色,变成了可用空间.对分区表进行操作尽量不要用磁盘管理,disk Genius ...

keil中的串口调试：

keil中串口的虚拟调试信息在通过View-serial windows-#usart1/2/3/4/debug(printf)可以看到.当然也可以通过虚拟串口VSPD+串口调试助手在外部实现,方法如 ...

首先看一下常用的几种编码方式 public class EncodeDemo { public static void main(String[] agrs)throws IOException { ...

多边形的性质

[多边形的性质] 1.如果一个多边形所有内角均小于180度,则为凸(convex)多边形.凸多边形的另一定义是它的内部完全在它的任一边及其延长线的一侧. 2.给定多边形顶点,计算连续的边向量叉积,如果 ...

yarn========================(类似于node)

facebook 公司的工程师感觉Node使用起来太慢,自己写的一个类似node的安装: npm install -g yarn 基本使用: yarn init [-y] 初始化 ...

UIBezierPath精讲

参考:http://www.jianshu.com/p/734b34e82135 基础知识使用UIBezierPath可以创建基于矢量的路径,此类是Core Graphics框架关于路径的封装.使用 ...

读“嵌入式Linux的调试技术”的心得

1对于复杂的Linux驱动及HAL等程序库,需要使用各种方法对其进行调试.例如设置断点.逐步跟踪代码.输出调试信息等. 2打印内核调试信息:printk,该函数与printf用法类似,但是printk ...

（三十七）Android开发中修改程序字体

1.在Android XML文件中设置系统默认的字体可以在XML文件中采用android:typeface设置字体,例如android:typeface=”monospace”.在这里例子中我们在A ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.