手势跟踪论文学习:Realtime and Robust Hand Tracking from Depth(五)Hand Initialization 2

论文阅读原创,转载标明出处:

回顾:

上一节我们说到了,作者通过自己定义的X-Y Finger和 Z-Finger来进行手指的检测,然后来初始化Hand Pose。其实勒,手指经常都会死斜着的。也就是说不会是标准的X-Y Finger和或者Z-Finger。那作者是如何的处理的勒?

手指的检测:

对于手指的检测,先进行X-Y Finger的检测。然后分割出去;再进行Z-Finger的检测。但是如果再进行Z-Finger的检测的时候,触及到X-Y
Finger的分割区域以后就停止,不再检测了。

为了提高速度,作者也讲分辨率将为原来的一半。

Hand Initialization:

我们假设检测到f个Finger(不管是X-Y Finger和或者Z-Finger)那么手指带来的自由度是2f。加上手腕的自由度6个,所以我们知道一个Hand
Pose的未知数个数(也就是参数的个数)是2f+6个。(所以我们至少需要2f+6个线性无关的已知才能解出这个方程)

我们再来看我们通过手指的检测得到多少的已知。

假设我们还是检测到f个Finger,那么我们通过PCA可以分析到手指的主成分,也就是手指的方向,这算是2个的约束(应该是一个向量吧)当找到一个手指额时候实际上指尖的空间位置也就定了吧这里又是3个约束(已知)。当我们去掉手指的点云点以后,就只剩下手掌了,这个时候,我们采用PCA又可以分析出手掌的方向,这里又是3个的约束(不是很明白,其实这个归根结底还是要去理解到那26个自由度代表的意义了)。所以我们可以说,至少我么有5f+
3个已知的条件。所以我们足够接触那几个未知数。

所以我们也知道最后那个方程里面各个参数的意义了。

其中的t代表的是指尖的位置(是未知变量的函数),d代表方向,l 代表手掌的方向。上面的方程就是要使得初始化的这个Hand Pose的手指尖和检测到的指尖的距离最小,方向最小,手掌的方向也最小。

如此就完全的理解了这一篇论文了。

望对大家有帮助。

iker,2014年9月15日。

时间: 2024-10-08 08:13:59

手势跟踪论文学习:Realtime and Robust Hand Tracking from Depth(五)Hand Initialization 2的相关文章

手势跟踪论文学习:Realtime and Robust Hand Tracking from Depth

本文介绍的方法主要是用到了深度信息.提出了一种新的手指检测以及手型初始化的方法.具有很好的鲁棒性.在不使用GPU的情况下,速度就可以达到25FPS.准确率还相当的高.可以说是现在手势识别中最好的方法了. 当前的很多方法要不就是很慢,要不就是使用了GPU,再或者就是需要非常复杂的初始化.而本文提出的方法重新定义了手势的模型,结合了现在通用的两种方法的优势,并且加上一个约束方程,得到了很好的效果. 1.模型的重新定义 每一只手,定义了一个自由度(DOF)为26 的手的模型,其中的6个自由度代表全局的

手势跟踪论文学习:Realtime and Robust Hand Tracking from Depth(三)Cost Function

iker原创.转载请标明出处:http://blog.csdn.net/ikerpeng/article/details/39050619 Realtime and Robust Hand Tracking from Depth中的Cost Function 学习 首先,我们应该知道,输入的数据是什么:3D 点云数据. 3D点云给我的感觉应该是这种 输出的是:拟合好的手模型(48球体模型). 而这里的的3D 点云数据用p表示,每个球体用Sx 表示. Ci 第i个球体的中心:D表示深度图( 区分还

手势跟踪论文学习:Realtime and Robust Hand Tracking from Depth(二)

论文细节 手势识别或者说手的跟踪在人机交互中非常重要,已经有几十年的研究.但是它存在的难点还是很多的:手的动作是由很多的复杂的手指的活动构成的,同时,在可变的大视角下面的快速移动. 目前做出来比较好的效果的做法有几种,一种使用了非常复杂的网格模型(mesh model,具体不知道是怎么做的),但局限性在于它的局部最优的方法速度也很差:另一种则是采用多边形模型(polygonal model),可以达到实时的效果,但是需要GPU来处理. 以上提到的方法局部最优的方法,也就说一旦找到一个局部最优值的

手势跟踪论文学习:Realtime and Robust Hand Tracking from Depth(四)Hand Initialization

论文阅读原创,转载请标明出处:http://blog.csdn.net/ikerpeng/article/details/39251373 在多次的阅读这篇论文以后才明白文章的结构为什么这样安排:将Hand Initialization这部分放在文章的所有的优化算法的最后,说明整个算法即便是不要这一部分的优化也是可以的.我们从文章中的Table 2可以看到,不使用Hand Initialization得到的结果比使用到Initialization的结果差2mm.若是你对于最终的结果要求不是很高的

【论文学习记录】PTAM:Parallel Tracking and Mapping for Small AR Workspaces

论文地址:链接: http://pan.baidu.com/s/1kTAcP8r 密码: djm4 这是一篇可手持单目相机进行定位与制图方法的文章.它与传统slam的方法不一致的地方在于将定位跟踪与制图分离出了两个单独过程. 双线程机制: 一个线程用于鲁棒跟踪手持相机运动,另一个线程用于从之前观测到的视频帧中产生三维地图点特征 .  系统允许batch techniques复杂的计算,但不在实时操作下.. 这篇文章的研究目的是:  不需要任何模板与初始目标,跟踪校正的手持相机,并且绘制环境地图.

学习OpenCV——hand tracking手势跟踪

这几日,岛上风云突变,我这个倒霉孩子终究木有躲过感冒的魔掌,中枪鸟~~~ 这几天只写了个简单的手势跟踪的代码. 原理是:背景差分+肤色检测. 背景差分:取前30帧图像取平均值,计算前30帧之差的和,再求均值.在背景平均值上下浮动的阈值之外的被检测出来. 肤色检测:利用YCrCb空间. 两个结果相与操作. 这种方式的优点:1.有效解决了肤色检测结果中总是检测到人脸的情况: 2.解决背景差分检测结果杂乱的情况: 缺点:背景要求相对稳定,反差越大越好,鲁棒性差. 注意事项:差分法由于涉及到累加图像,编

【 论文学习记录】A flexible and scalable slam system with full 3d motion estimation 一种灵活可扩展带有3D运动估计的slam系统

A flexible and scalable slam system with full 3d motion estimation   论文学习记录 这篇论文系统框架,栅格多阈值,更新同步与伪数据,扫描匹配起始点,协方差交叉融合的思想还是值得借鉴的. 摘要 关注于搜救机器人建图定位与导航的框架性文章. 低计算资源的在线快速获取栅格地图: 结合鲁棒的激光扫描匹配方法和惯性传感器姿态估计系统. 快速地图梯度近似与多分辨率(类似图像金字塔)栅格地图,精确而不需要闭环检测. 介绍 2D slam 子系

基于meanshift的手势跟踪与电脑鼠标控制(手势交互系统)

转自网络:http://blog.csdn.net/zouxy09/article/details/17913745 基于meanshift的手势跟踪与电脑鼠标控制(手势交互系统) [email protected] http://blog.csdn.net/zouxy09 一年多前开始接触计算机视觉这个领域的时候,年幼无知,倍感吃力.当年惶恐,从而盲从.挣扎了不少时日,感觉自己好像还是处于领域的门外汉一样,在理论与实践的鸿沟中无法挣脱,心里空落落的.在这种挥之不去的烦忧中,某个时候豁然开朗,觉

android开发学习之路——连连看之游戏逻辑(五)

GameService组件则是整个游戏逻辑实现的核心,而且GameService是一个可以复用的业务逻辑类. (一)定义GameService组件接口 根据前面程序对GameService组件的依赖,程序需要GameService组件包含如下方法.   ·start():初始化游戏状态,开始游戏的方法.     ·Piece[][] getPieces():返回表示游戏状态的Piece[][]数组.     ·boolean hasPieces():判断Pieces[][]数组中是否还剩Piec