目标跟踪文章翻译--基于主动特征选择的鲁棒目标跟踪

摘要:基于检测的自适应跟踪已经被广泛研究了且前景很好。这些追踪器的关键理念是如何训练一个在线有识别力的分类器,这个分类器可以把一个对象从局部背景中分离出来。利用从检测目标位置附近的当前帧中提取的正样本和负样本不断更新分类器。然而,如果检测不准确,样本可能提取的不太准确,从而导致视觉漂移。最近,基于跟踪的多实例学习(MIL)已经在某些程度上提出了一些解决这些问题的办法。它将样本放入正负包中,然后通过最大化似然函数用在线提升的办法选择一些特征。最后,被选择的特征相结合用于分类。然而,在MIL追踪里,通过似然函数选择特征,这样从复杂的背景提取的目标具有较少的信息量。受主动学习的方法的启发,在本文中,我们提出一个主动特征选择的方法,通过利用费舍尔信息准则测量分类器模型的不确定性,我们能够选择比MIL跟踪器携带更多信息量的特征。更具体地说,通过优化费舍尔准则,我们提出了一个在线提升特征选择方法。可以产生更加鲁棒和高效实时跟踪性能。与先进的跟踪器相比,基于挑战性序列的实验评估展示了本文提出的跟踪器的效率,准确性,和鲁棒性。

关键字:主动学习;信息准则;多实例学习;视觉跟踪

1引言

在计算机视觉领域里面,视觉跟踪是一个非常活跃的研究主题,有着很重要的地位,特别是在车辆导航、交通监测以及人机交互等应用方面[1]。虽然在近几十年来目标跟踪领域已经提出了很多算法,但它一直以来都存在着一个重大的难题,即目标物体的外观会因为某些因素而产生重大的变化,例如光照变化、姿势变化、遮挡问题、突然的运动。这些因素都会导致跟踪的结果产生视觉漂移等问题。因此,设计一个高性能的跟踪系统的关键在于如何设计一个鲁棒的外观模型,从而能够很好地处理以上所提到的问题。

有些外观模型仅仅表示物体,而有些外观模型既考虑物体,又考虑局部背景。后者的方法比前者好,因为它把跟踪问题当做一个二进制的分类问题,通过一个有区分能力的分类器把目标从背景中分离出来。考虑到这些方法与目标检测任务比较相关,它们经常被称为基于检测的跟踪。当训练分类器的时候,正负样本的选择会影响跟踪的性能。大多数跟踪系统会选择当前的帧作为正样本。如果跟踪的位置不精确,分类器就会以一个错误的正样本进行更新,从而随着时间的推移会导致视觉漂移。为了减轻漂移问题,跟踪的目标位置附近的多样本可以用来训练分类器。用传统的监督学习的方法去训练分类器,会产生模糊歧义的问题。[2]。

最近,为了解决跟踪的模糊歧义问题,有人提出了多实例学习(MIL)。样本被放入包中且只提供包的标签。如果包中有一个正样本,那么就为正包;如果包中所有的样本都是负样本,那么就是负包。选择跟踪位置附近的样本放入正包中,选择远离跟踪位置的样本放入负包中。通过优化包的似然函数来设计分类器,为了处理外观的不断变化,通过最大化包的似然函数提出一个在线的MIL提升算法来顺序从特征池中选择有区分能力的特征。最后把所选择的弱分类器线性组合成一个强分类器,从而在下一帧把物体从背景中分离处理。实验表明它比先进的跟踪器能够更好地处理视觉漂移的问题[2]。

尽管他们取得了成功,但是,MIL跟踪器[2]有以下的缺点。第一、所选择的特征携带较少的信息量。为了使分类器有足够的区分能力,就需要从特征池中选择大量的特征,这就给计算带来了不便。第二、选择的特征越多,这些特征之间的区别就越小,这也会降低分类器的性能,从而导致漂移。

为了解决上述问题,受主动学习方法的启发[3],本文提出了一种主动特征选择的方法来选择携带更多信息量的特征——主动特征选择(AFS)。通过优化包的费舍尔信息函数(而不是包的似然函数)提出了一种在线的特征选择方法。因此,所选择的特征比MIL跟踪器中通过包的似然函数所选择的特征携带更多的信息量。因此就可以用更少的特征去设计分类器了,这笔MIL跟踪器的分类器更加有效和鲁棒。基于挑战视频序列的实验结果表明了AFS的方法在有效性、精确度和鲁棒性等方面都有一定的优势。

本文的其余部分组织如下。一些相关的工作是在第二部分回顾了。在第三部分中,我们详细介绍了我们的跟踪算法。第四部分把我们的追踪器与先进的追踪器进行了比较。最后,第五部分是结论。

2相关工作

视觉跟踪已经被广泛的研究,一个好的回顾可以在[1]中看到。根据如何处理目标对象和背景的外观变化,最近的算法主要分为两类:生成方法[4]—[12]和有识别力的方法[2],[13]-[21]。生成方法通过最小化搜索区域和涉及的目标模型之间的差异学习目标对象的外观模型。Black等人[4]通过离线学习子空间模型表述物体。为了处理目标外观的不断变化,提出了一些在线的外观更新模型。Jepson等人[5提出了]高斯混合模型,由一个在线期望最大化(EM)算法更新。Ho等人[6]和罗斯等人[7]使用增量子空间更新方法去适应外观变化。Adam等人[8]提出了基于分块的外观模型去处理姿势变化和部分遮挡。最近,提出的稀疏表达的方法处理视觉跟踪里的部分遮挡问题[9]。Kwon[10]把观察模型分解为多个基本观测模型,涵盖了不同类型的特征和运动来处理姿势变化,光照和尺度变化。Sun等人[11]提出一个物体外观模型,它结合了局部的尺度不变特征和整体增量主成分分析(PCA)。

通过训练一个有判别能力的分类器,从而把物体从背景中分离出来,判别方法把跟踪看为二进制分类问题。Avidan[13]训练一个离线支持向量机(SVM)并组合成一个基于光流的追踪器。为了适应对象和背景的外观变化,Avidan[14]提出在线提升方法来训练分类器:有些弱分类器以在线的方式更新,然后组合成一个强分类器。Collins等人[15]提出了一个在线特征选择方案,可以评价多个特征,并把这个方法与mean-shift跟踪系统[12]结合起来,并选择最有识别能力的特征。在[16],利用对象和结构化环境之间的关系利用提高跟踪的性能。Grabner等人[17]开发了一个在线提升特征选择技术,展示了良好的性能去自适应处理外观变化。为了更好地处理视觉漂移,Grabner等人[18]提出了一种在线半监督跟踪器,它只在第一帧标签样本,而不标签后继帧的样本。Babenko等人[2]提出使用一个在线MIL方法处理跟踪位置的模糊歧义问题,以减少视觉漂移。Kalal等人[19]提出了半监督学习方法,通过一个拥有结构约束的在线分类器选择正负样本。最近,一个基于压缩传感理论[22]的有效跟踪算法[21]被提出了,这表明,从高维多尺度图像特征空间随机提取的低维特征可以保留识别能力,从而促进目标跟踪。

3基于自适应特征选择的跟踪

A 系统综述

图1说明了我们跟踪系统的基本流程。在我们跟踪系统里有两个重要的部分。一个是如何检测物体在下一帧的位置,另一个是如何更新分类器。我们描述第t帧目标的位置为。旧目标位置附近的一系列图像块记作,s是搜索半径,x代表图像块。然后,对于所有的我们计算分类器响应,分类器是一些弱分类器的线性组合。最后,我们用贪婪策略更新目标位置

(1)

当所有的目标位置更新以后,一系列样本被采样,并放入一个正包中,r是一个标量半径。对于负样本,我们随机选取一些样本,,是一个标量半径,因为包含大量的样本。如果两个连续帧之间没有变化很多,负样本块(不是来自目标周围的边界区域)也许对分类有利,因为他们是相关的。然而,如果背景严重改变,这样的负块也许对分类有边缘效应,因为它们不太相关。为了协调,我们仅考虑目标周围的负样本。我们把所有的负样本放入一个负包中,通过用在线的方法最大化包的费舍尔信息损失函数来跟新分类器。

B MIL跟踪器

我们首先简短地回顾MIL跟踪器[2],这和我们的工作很相关。MIL方法是Dietterich等人介绍的,为了处理药物活性预测。假设我们有一系列的N包,每一个包有ni个实例。是包的标签,是实例的标签。MIL定义,如果包是正的,则至少有一个实例标签是正的。如果包标签为0,则所有对应的实例标签都为0。MIL跟踪器寻找判别分类器,可以返回条件概率。由于判别分类器是一个实例分类器,且和实例的条件概率相关,Noisy-OR模型用来利用实例的条件概率去估计包概率

(2)

实例概率 (3)

是sigmoid函数,通过最小化包的对数似然损失函数学习分类器

(4)

为了处理外观变化,提出在线MIL提升算法去更新分类器。首先,维持弱分类器,然后通过最大化包的对数似然,选择少量的弱分类器

其中,是前k-1个弱分类器组成的强分类器,是拥有M个候选弱分类器的弱分类器池。类似于脸部检测[24]中的提升特征选择方法,弱分类器可以被看作特征选择,因为每一个弱分类器对应一个特征。特征选择对于减少视觉漂移是非常有用的[15]。此外分类器可以有效运行,因为选择特征的数量比特征池中的少的多。

C AFS原理

从(4)中的对数似然函数,我们可以发现(5)中的特征选择方法是选择弱分类器,目的是最大化正包的条件概率和最小化负包的条件概率。我们认为与优化费舍尔信息准则后的特征相比,被选特征携带更少的信息量,下面会介绍的。因此,为了确保足够的判别信息,在MIL中,选择了相对多的特征(K=50,M=250),在AFS中,K=15,M=50。此外,如果太多的特征被选择,目标和背景特征之间的判别会减少。

类似于MIL跟踪器[2],我们定义分类器如下形式

其中,是一个权重向量,是一个弱分类器向量。h中的每一个元素都是一个决策树函数,返回二进制标签(+1或-1)。为了设计分类器,我们需要估计对应的参数α。Cramer–Rao不等式[25]表明,对于α的任意无偏估计,它们是独立同分布的样本,tn的协方差应该满足是一个非非正定矩阵,其中I(α)是费舍尔信息矩阵[25],定义为

费舍尔信息矩阵表示了分类模型的整体不确定性,这在主动特征方法[26]中经常用到。在[26]中,对于主动学习每一个询问,选择可以减少费舍尔信息的未标签样本。为了测量AFS分类模型的不确定性,我们使用基于包概率样本的费舍尔信息矩阵

其中,是包标签,δIm(δ>0是一个标量参数,Im是一个单位矩阵)被增加使得I(α)非奇异。因此,如何选择δIm不影响特征选择步骤。在(8)中,和通过(2),(3),(6)表达如下:

请注意,我们的信息矩阵(8)是不同于最近研制的多实例主动学习(MIAL)方法[27]和[28] 的目标函数,因为当标签是已知的,我们的目标是衡量分类模型的不确定性,虽然MIAL的目的是测量未标签样本的分类模型的不确定性。

逆费舍尔信息矩阵I(α)-1是估计α的协方差矩阵的较低边界[25]。作为特殊例子,det(I(α)-1)是α中元素的协方差乘积的较低边界。因此,Liao等人[29]提出选择样本最大化det(I(α)-1),减少α的不确定性。然而,由于很难计算det(I(α)-1),我们减少 矩阵I(α)的迹,因为det(I(α)-1)的上界是。很容易证实det(I(α)-1)≤。因为I(α)是一个正定对称矩阵[25],所有的特征值都是正数[30]。因此,有如下不等式[30]

在(11)中,设置,因为每个元素是一个决策树函数。请看附录A。

虽然(11)看起来很复杂,它的物理意义很简单。对于正包,[31],矩阵I(α)迹中的正包可以简化为。为了最小化函数,我们需要最大化和。类似于包似然函数(4),第一步是最大化正包的条件概率。第二步是达到最大值,可以测量实例的分类不确定性。矩阵I(α)迹中的负包包括两个部分:和。分析和正包是一样的。因此,最小化矩阵的迹可以看作是包概率和分类不确定性之间的权衡。下面,我们提出AFS,通过最小化矩阵的迹去选择有信息量的特征。

D 在线AFS提升

当顺序选择弱分类器来优化特定的目标函数时,我们用统计的观点看待提升[32](每个弱分类器对应一个特征):

其中,是前k-1个弱分类器组成的强分类器。Φ是所有可能的弱分类器的集合,对于在线学习,我们保持M个候选弱分类器的特征池。当更新强分类器的时候,我们首先用最新的样本更新弱分类器,然后通过最小化费舍尔信息矩阵顺序选择K(K

时间: 2024-10-21 12:51:25

目标跟踪文章翻译--基于主动特征选择的鲁棒目标跟踪的相关文章

基于最大一致性上下文的广域车辆跟踪

基于最大一致性上下文的广域车辆跟踪 最大一致性 MTT 广域运动图像 读"X. Shi, P. Li, H. Li, W. Hu, E. Blasch, Using Maximum Consistence Context for Multiple Target Association in Wide Area Traffic Scenes[J], ICASSP, 2013." 笔记. 首先该论文中提出了最大一致性上下文信息,主要用于wide area traffic scene. wi

【计算机视觉】基于Kalman滤波器的进行物体的跟踪

预估器 我们希望能够最大限度地使用測量结果来预计移动物体的运动. 所以,多个測量的累积能够让我们检測出不受噪声影响的部分观測轨迹. 一个关键的附加要素即此移动物体运动的模型. 有了这个模型,我们不仅能够知道该移动物体在什么位置,同一时候还能够知道我们观察支持模型的什么參数. 该任务分为两个阶段.在第一阶段,即预測阶段.用从过去得到的信息进一步修正模型以取得人或物体的下一个将对出现的位置.在第二阶段,即校正阶段,我们获得一个測量.然后与基于前一次測量的预測值(即模型)进行调整.完毕两个阶段预计任务

工作中接触到的框架记录了解【网络文章翻译】

Backbone.js 优点:强大的社区和大量的势头. Underscore.js也是一个伟大的框架. 缺点:缺乏坚强的抽象和令人不满意.整个框架是出奇的轻巧,导致大量的样板.一个程序越大,这情况就越明显. Knockout.js 是一个MVVM框架,从它的支持者受到的好评很多.它强调声明UI绑定和自动更新用户界面. 优点:绑定的支持.大文件和惊人的导师制. 缺点:尴尬的绑定语法,缺乏坚实的视图组件层次结构.我想能够轻松地重复使用的组件.我也觉得像识别为MVVM框架是有害的.几乎没有这些框架的任

[翻译]如何安装ACRA-一个Android应用Crash跟踪系统

[翻译]如何安装ACRA-一个Android应用Crash跟踪系统 -在你自己的服务器上 How to setup ACRA, an Android Application Crash Tracking system, on your own host 原文地址: http://inthecheesefactory.com/blog/how-to-install-and-use-acra-android/en 开发一个手机应用有如此多的限制,比如硬件限制(CPU,内存,电池等等).如果你的代码不

DIY一个基于树莓派和Python的无人机视觉跟踪系统

DIY一个基于树莓派和Python的无人机视觉跟踪系统 无人机通过图传将航拍到的图像存储并实时传送回地面站几乎已经是标配.如果想来点高级的--在无人机上直接处理拍摄的图像并实现自动控制要怎么实现呢?其实视觉跟踪已经在一些高端的消费级无人机上有了应用,不过玩现成的永远没有自己动手来劲;).前段时间DIY了一个无人机三轴云台的视觉跟踪系统,除去云台花了¥370,本文将设计思路与实验效果分享出来. 一.基本配置 1.1 硬件 计算平台:树莓派3 (¥219.00) 摄像头:USB网络摄像头(¥108.

ODL Wiki文章翻译活动启动 招募译者及审校

OpenDaylight是一个以社区为主导,以产业链为支撑的开源项目,该项目推出了一个名为"OpenDaylight"的开源框架,旨在促进创新,以更加平稳.安全的方式向软件定义网络过渡.只要你关注SDN技术,就无法不注意到OpenDaylight. 为了更好的推进OpenDaylight相关技术在国内的发展,让更多开发者了解OpenDaylight,CSDN CODE 联合OpenDaylight中文社区(SDNLAB.com旗下频道)推出了OpenDaylight Wiki文章翻译活

基于 DirectX11 的 MMDViewer 04-渲染目标视图和多视口

这篇文章主要介绍渲染管线输出部分的内容:交换链和渲染目标对象,并且介绍多视口渲染方法. 交换链: 要创建交换链,必须先设置交换链描述.交换链描述定义了将由交换链使用的渲染缓冲区的大小和数量.它还将窗口与交换链相关联,从而确定最终图像的显示位置.交换链描述还定义了该应用的消除锯齿(如果有的话)的质量以及在展示过程中后端缓冲区的翻转方式. UINT create_device_flags = 0; #ifdef _DEBUG create_device_flags |= D3D11_CREATE_D

文章翻译集锦

文章翻译集锦 序 在阅读部分英文文档的时候,有几点妨碍因素: 1.服务器在国外,水土不服: 2.软件翻译有时候失败: 3.加载速度有点慢.有时候不是一般的慢: 4.网站经常打不开: ... ... 系列 IdentityServer4系列(目前已经整理完毕):http://nidie.com.cn/Blogs/Articles ABP(待整理): 原文地址:https://www.cnblogs.com/liqingwen/p/9363450.html

Tracert(跟踪路由)是路由跟踪实用程序,用于确定 IP 数据包访问目标所采取的路径

Tracert(跟踪路由)是路由跟踪实用程序,用于确定 IP 数据包访问目标所采取的路径. Tracert 命令用 IP 生存时间 (TTL) 字段和 ICMP 错误消息来确定从一个主机到网络上其他主机的路由.其命令格式如下: tracert [-d] [-h maximum_hops] [-j computer-list] [-w timeout] target_name -d 指定不将地址解析为计算机名. -h maximum_hops 指定搜索目标的最大跃点数. -j host-list