Real-Time Compressive Tracking 论文笔记

整体思想



1 利用符合压缩感知RIP条件的随机感知矩阵对多尺度图像进行降维

2 然后对降维的特征采用简单的朴素贝叶斯进行分类

算法主要流程



1 在t帧的时候,我们采样得到若干张目标(正样本)和背景(负样本)的图像片,然后对他们进行多尺度变换,再通过一个稀疏测量矩阵对多尺度图像特征进行降维,然后通过降维后的特征(包括目标和背景,属二分类问题)去训练朴素贝叶斯分类器()。

2 在t+1帧的时候,我们在上一帧跟踪到的目标位置的周围采样n个扫描窗口(避免去扫描整幅图像),通过同样的稀疏测量矩阵对其降维,提取特征,然后用第t帧训练好的朴素贝叶斯分类器进行分类,分类分数最大的窗口就认为是目标窗口。这样就实现了从t帧到t+1帧的目标跟踪。

Relate Work


Issuse of online tracking algorithms(update models with samples from observations in resent frames)

1 adaptive appearance models are data-dependent, but there does not exist sufficient amount of data for online algorithms at out set

2 drift problems

How To Do


1 生成随机测量矩阵

Achlioptas [16] proved that this type of matrix withs = 2 or 3 satisfies the Johnson-Lindenstrauss lemma. [17]证明,满足JL条件的话即满足CS的restricted isometry property in compressive sensing. 从而我们能够从降维后的v最好的重建x,其中v=Rx,R为随机矩阵

2 得到x向量

w,h是所选目标的宽长,我们用上面一系列不同尺度的矩形来对图像进行类似haar-like的向量生成,一共是wxh个rectangle filters,对每个像素进行卷积,生成m=(wh)^2个x,虽然m很大很大,因为随机测量矩阵十分稀疏,可以降到很小的n维

3 如下做降维处理

4 构建并更新分类器

假设降维后的数据是独立的分布,用以下朴素贝叶斯进行分类(4)

Since Diaconis and Freedman [23] showed that the random projections of high dimensional random vectors are almost always Gaussian, we assumed p(vi|y=1)andp(vi|y= 0) in the classifier to be Gaussian.

参数采用下式(6)进行递增的更新

类似高斯的直观图

5 整体算法为

Discussion


1 因为本文算法是data-independent的,所以不像1-tracker [10] ,compressive sensing tracker [9] 这些生成模型,不需要存储以前的训练样本;所采用广义的haar-like,不像[9][10]采用holistic templates for sparse representation,本文的特征更为鲁棒

2 PCA和它的变种广泛应用在了生成跟踪模型的方法里[1,6],但这些方法因为用的是holistic representation,对遮挡不鲁棒; 而且不一定能update correctly with new observations;压缩跟踪不存在self-taught learning approaches存在的这些问题,因为利用随机测量矩阵的这个模型是data-independent的;random projection
好于 principal component analysis

3 The tracking-by-detection methods often encounter the inherent ambiguity problems as shown in Figure below. Babenko et al. [8] introduced multiple instance learning schemes to alleviate the

tracking ambiguity problem

4 measurement matrix is data-independent and no noise is introduced by mis-aligned samples

5 Similar representations, e.g., local binary patterns [26] and generalized Haar-like features [8], have been shown to be more effective in handling occlusion.

Experiment


1 用到的评价标准 1 ROI 2 center location error

2 Algorithm combines the merits of generative(features?) and discriminative(bayes?) appearance models to account for scene changes

时间: 2024-10-18 13:05:35

Real-Time Compressive Tracking 论文笔记的相关文章

Staple: Complementary Learners for Real-Time Tracking 论文笔记

Staple: Complementary Learners for Real-Time Tracking 论文笔记  相关滤波相关的跟踪算法,最近非常的流行,对运动模糊和光照变换有一定的鲁棒性.但是,由于像模型展示的那样,他们的跟踪结果严重的依赖于跟踪物体的空间布局,对形变非常的敏感(deformation).基于颜色统计的模型有互补的性能:他们对物体的外形有较好的处理能力,但是,对出现的光照变量却无法很好的应对.此外,仅仅依赖于颜色统计,没有那么好的判别性.本文提出一种简单的跟踪算法,结合互

Correlation Filter in Visual Tracking系列二:Fast Visual Tracking via Dense Spatio-Temporal Context Learning 论文笔记

原文再续,书接一上回.话说上一次我们讲到了Correlation Filter类 tracker的老祖宗MOSSE,那么接下来就让我们看看如何对其进一步地优化改良.这次要谈的论文是我们国内Zhang Kaihua团队在ECCV 2014上发表的STC tracker:Fast Visual Tracking via Dense Spatio-Temporal Context Learning.相信做跟踪的人对他们团队应该是比较熟悉的了,如Compressive Tracking就是他们的杰作之一

Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪,算是单目标跟踪中比较早的应用强化学习算法的一个工作.  在基于深度学习的方法中,想学习一个较好的 robust spatial and temporal representation for continuous video data 是非常困难的.  尽管最近的 CNN based tracke

《Real-Time Compressive Tracking》论文理解

     这是Kaihua Zhang发表在ECCV2012的paper,paper的主题思想是利用满足压缩感知(compressive sensing)的RIP(restricted isometry property)条件的随机测量矩阵(random measurement matrix)对多尺度(multiple scale)的图像特征(features)进行降维,然后通过朴素贝叶斯分类器(naive Bayes classifier)对特征进行分类预测目标位置.   首先介绍下paper

Real-Time Compressive Tracking,实时压缩感知跟踪算法解读

这是Kaihua Zhang发表在ECCV2012的paper,文中提出了一种基于压缩感知(compressive sensing)的单目标跟踪算法,该算法利用满足压缩感知(compressive sensing)的RIP(restricted isometry property)条件的随机测量矩阵(random measurement matrix)对多尺度(multiple scale)的图像特征(features)进行降维,然后通过朴素贝叶斯分类器(naive Bayes classifi

压缩跟踪Compressive Tracking

好了,学习了解了稀疏感知的理论知识后,终于可以来学习<Real-Time Compressive Tracking>这个paper介绍的感知跟踪算法了.自己英文水平有限,理解难免出错,还望各位不吝指正. 下面是这个算法的工程网站:里面包含了上面这篇论文.Matlab和C++版本的代码,还有测试数据.demo等.后面我再学习学习里面的C++版本的代码,具体见博客更新. http://www4.comp.polyu.edu.hk/~cslzhang/CT/CT.htm 之前自己稍微学习了下稀疏感知

论文笔记(1)——《Where&#39;s Wally?Precise User Discovery Attacks in Location Proximity Services》

Abstract: 位置相近服务在社交和移动网络的广泛使用是基于可用性和用户隐私的平衡,但引发了三角定位攻击的风险.文章系统化地讨论了此类攻击的防范,包括问题在不同临近模型下的形式化,针对不同模型的有效攻击,以及攻击需要的询问次数的确界,并针对实际应用进行实验. 一)对攻击的建模:UDP,已知包含点p的欧氏平面区域A以及一个提供邻域信息的黑箱,找到点p的位置 邻域(proximity oracle)定义:,以某点为圆心的区域 原问题化为两部分: 1)Disk Coverage:将A用最少的r-邻

Kalman论文笔记

笔者前段时间阅读了一些关于Kalman的姿态论文,本想把Kalman的知识点也整理出来发布,无奈这编辑器不给力,太多的公式无法复制粘贴,图片格式上传的太复杂,就放弃了.因此笔者只发布Kalman的论文笔记,用表格的形式分析了几篇论文的Kalman filter的结构,希望对大家有帮助. 表格中包含有 论文名称 状态变量 转移矩阵 观测变量 观测矩阵 过程噪声 观测噪声 备注 百度网盘:pan.baidu.com/s/1kT1iC6r

DL4NLP —— 看图说话(Image Caption)任务的论文笔记(一)评价指标和NIC模型

看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字.应用场景:比如说用户在拍了一张照片后,利用Image Caption技术可以为其匹配合适的文字,方便以后检索或省去用户手动配字:此外它还可以帮助视觉障碍者去理解图像内容.类似的任务还有Video Caption,输入是一段视频,输出是对视频的描述. (一)任务描述 目前来说,Image Caption任务主要集中在英文上,数