在线多实例学习online MIL

目标跟踪是计算机视觉领域里一个很重要的课题,而在线多实例学习方法是应用在视觉跟踪上的。关于这方面的讲解,网上能搜到的很少,于是自己看了若干文献,简单总结下,个人理解的不是很透彻,有不对的地方还望指正。

Visual Tracking with Online MultipleInstance Learning:

通常一个跟踪系统会包含3个部分:image representation,appearance model, and motion model。MIL算法针对的是外观模型这一部分,当然也会用到特征描述。

以往很多现成的算法对跟踪效果不好主要是因为目标外观或者背景的变化,后来有不少针对这方面的研究,思想是利用机器学习的算法来学习一个有可区分度的分类器来把目标从背景分离出来。因为这种方法和目标检测很类似,通常称作“基于检测的跟踪”。

训练样本的生成是这种跟踪方法的一个难题。一种普遍的方法是在当前跟踪的位置取一个正样本,在跟踪位置的周围取一些负样本,但是如果跟踪的不准确,那么外观模型得不到好的更新结果,长时间后会造成漂移。另一种方法是在跟踪位置的一个小的邻域范围内取若干正样本,在远离的地方取负样本,这样的问题是因为存在虚检的正样本,分类器在判断最具有区分性的特征时会受到干扰混淆。为了解决这一问题,MIL算法得以提出。不同之处在于,MIL算法里提出样本袋的概念,所有的正样本(当前跟踪位置的小邻域范围里选取)加入到一个样本袋里,正样本袋具有不确定性(含有虚检),每一个负样本单独作为一个样本袋,负样本袋没有不确定性。如下图所示:

MIL算法基于boosting的思想,从M个特征对应的M个弱分类器中选择出K个弱分类器(对应K个特征,组成新的外观模型),然后组合成强分类器,并告诉我们在这个正样本袋里哪一个实例才是最正确的。新的位置就是这个实例的位置。如下图所示。这篇文章里M=250,K=50。特征选的是类haar特征。

ParticleFilter TrackingWith Online Multiple Instance Learning:

这篇文章是对上面这篇文章的改进,上篇文章里提到关于正样本位置的选取用的很简单的方法,就在当前跟踪位置的一个小邻域里随机抽取,这篇文章改进之一是利用粒子滤波的方法,在粒子的位置上选取正样本。改进之二是对MIL算法的改进,主要有:

  • 相比Noisy-OR模型,对bag是正样本的概率计算进行了修改:

 ------------------------>>>>>>  

考虑到几何平均的计算可以避免数值过大的问题

  • 运用梯度下降的思想,加入了权值w,w是似然函数L的导数

原谅LZ这里没有看懂怎么推倒出来的。= =

  • 弱分类器的选择h

------------------------>>>>>>

这篇文章里M=250,K=50。特征选择依旧是类haar,并且加入了颜色特征。

How does personal identity recognition helpmulti-person tracking:

这篇文章里提到外观相似度模型。用到3种特征:颜色、HOG、协方差矩阵。对两幅图片相似度s的计算可以考虑相关系数、巴氏距离等等,特征之间的距离就可以当做一个弱分类器,然后通过学习算法学习各种特征的权值。实验表明:颜色特征被选择的最多,纹理特征选择的最少。颜色特征提取的区域要小,HOG特征提取的范围要大。

CVPR2013-- Multi -Target Tracking by Online Learning of Non-linear Motion Patterns and Robust AppearanceModels:

最后这个跟踪算法的文章。它运用了改进的MIL算法(第二篇文章)和外观相似度模型(第三篇文章)。看了很多天这个MIL算法,简单说下我自己对这个MIL算法的大概理解,其实我也没有完全看懂它的意思。算法如下:

外层循环是选择出T个最具区分性的特征,内层循环是遍历所有的K个特征。

第一句:对每个特征下每个样本对的相似度通过sigmoid函数转化为概率(这个概率实际上是该样本对是同一个目标的概率)。

第二句:每个样本袋里面至少有一个样本对是同一个目标的概率,因为正样本袋只有一个,里面有若干个样本对,所以xi的绝对值为正样本对的总数,而负样本袋有若干个,每个里面只有一个样本对,所以xi的绝对值为1。这里计算概率的时候xi要分正负样本来考虑。

第三句:按照公式来求w,求的是每个样本对的权值。

第四句:按照公式来选择第k个特征,这个特征是当前所有特征中最具区分的特征。

第五句:按照线性搜索的方法给该特征分配权值,使得似然函数最大。

另外说下我看了这些文章的感受,我觉得这种方法用在最后那个跟踪算法上有一定的道理,但也觉得比较虚。一方面不同的目标3种特征的区分能力不一样,这种方法的目的就是找出能最大程度区分不同目标的特征,并赋予一定的权值。如果我们赋予固定的权值,或者3种特征不进行筛选,那么对所有目标而言这3种特征的贡献都一样,必然没有MIL算法具有区分性,可能会导致不同目标的轨迹被错误连接(这是我的感觉,可以实现下看看效果)。但是另一方面,前面的文献里提到M=250,K=50,而这里M=3,K<M,K取的是2,感觉特征太少,或者说弱分类器数目太少了,感觉用这种方法很牵强。个人观点。

时间: 2024-10-12 00:16:08

在线多实例学习online MIL的相关文章

目标跟踪文章翻译--基于主动特征选择的鲁棒目标跟踪

摘要:基于检测的自适应跟踪已经被广泛研究了且前景很好.这些追踪器的关键理念是如何训练一个在线有识别力的分类器,这个分类器可以把一个对象从局部背景中分离出来.利用从检测目标位置附近的当前帧中提取的正样本和负样本不断更新分类器.然而,如果检测不准确,样本可能提取的不太准确,从而导致视觉漂移.最近,基于跟踪的多实例学习(MIL)已经在某些程度上提出了一些解决这些问题的办法.它将样本放入正负包中,然后通过最大化似然函数用在线提升的办法选择一些特征.最后,被选择的特征相结合用于分类.然而,在MIL追踪里,

集成Android免费语音合成功能(在线、离线、离在线融合)

集成Android免费语音合成功能(在线.离线.离在线融合),有这一篇文章就够了(离线)集成Android免费语音合成功能(在线.离线.离在线融合),有这一篇文章就够了(离在线融合) 转眼间,大半年没写文章了,没什么理由,就是人变懒了.囧~ 看标题,其实大家都被骗了,有这一篇文章还不够,我其实是打算分3篇文章来写的,如果合在一章里面就太长了,不过现在这个标题党横行的网络世界,我也被污染了,哈.那么为什么要分3篇文章来讲呢?看标题也能猜到了,就是在线.离线.离在线融合这3种语音合成方式,我将分别使

ESXI-P2V-V2V-应用虚拟化-在线转移

P2V-V2V-虚拟化应用 实战背景: 1.由于企业采购财务软件T3暂不支持win10 . 2.一台计算机无法安装多个版本T3客户端,从而实现对T3服务器的访问操作. 3.财务软件U8和T3安装在同一台电脑安装上存在兼容性问题. 解决方案:在现有ESXI平台上创建多台虚拟机(2003),在虚拟系统中安装各版本T3客户端,然后再安装易速联虚拟化应用软件服务器端,在用户端(财务电脑)安装异速联客户端软件,连接服务器实现对各T3服务器访问操作过程. EXSI现有平台:  操作步骤: 1.在ESXI平台

谷歌抢赢AWS,在线公有云培训平台Qwiklabs收入囊中

作者:茱莉叶 [IT战略家] 美国时间11月21日,谷歌宣布收购在线培训平台Qwiklabs.Qwiklabs是一个在线商业培训平台,为想要熟悉公有云环境操作,以及在公有云环境编程开发的人群提供教学.谷歌将使用 Qwiklabs 平台,提供最全面.高效和有趣的方式来训练和加载其所有在Google Cloud的所有产品(包括Google Cloud Platform和G Suite).双方均尚未透露此次收购价格. 谷歌将通过Qwiklabs平台提供云服务培训 Qwiklabs 于2012年推出,总

首次尝试集成迅雷高速下载引擎用于终端用户自助在线系统安装场景

笔者所在行业属于传统制造业,专业软件种类很多和因多种历史原因造成的许多管理问题相对地IT问题自然也很多,免不了系统重装(全体WINDOWS环境)概率会高一些,传统意义有些企业可能是IT终端运维人员介入重装或者采用一些国产卫士软件内带的功能来进行重装,更多也可能会采用RIS远程部署之类,但在某些行业终端用户眼里仍然显得不够自动化,不够IT管理标准化,离我们理解的"无人值守"仍然还有一定的差距,能不能让用户自助式傻瓜化系统重装并在安装成功后标准化部署好公司要求的软件环境?经过一些时间的摸索

在线考试系统(Online Exam System)--ASP.NET

用户设计 -|学生 -|老师 -|管理员 学生结构设计 -|个人信息管理 -|修改个人信息 -|修改登录密码 -|选课中心 -|显示所有老师所开课的信息可进行选课 -|显示自己已选课程 -|在线考试 -|对已选老师开设的课程选择进行考试 -|成绩查询 -|查看自己考试成绩   老师结构设计 -|个人信息管理 -|修改个人信息 -|修改登录密码 -|课程管理 -|显示学校开设的课程(老师可选择添加课程) -|显示老师开设的课程 -|考试管理 -|显示老师自己开设的课程 -|对课程添加试题(选择.填

老男孩IT教育在线3期的学习自我介绍与决心书

哈喽,大家好!我叫代少齐,来自北京,学历大专,专业是地理信息系统应用与开发,上次的自我介绍不知道是什么时候了,很感谢老男孩给我这次机会.工作三年了,90后的我刚走出校园时,自信满满,对生活充满了希望.(*^__^*) 嘻嘻--.我的第一份工作干的地图的二次开发,这个行业不是很吃香,干开发的这一年学到了很多知识和经验,有喜有忧.喜是学到很多工作经验和为人处世,忧是做事情比别人慢半拍而且逻辑思维不强,学的很痛苦.正因为这我不得不辞掉开发的工作,后来找了份测试相关的行业,那是第一次接触Linux操作系

“零感知”在线迁移解决方案

内核报错.CPU工作不正常.硬盘故障.业务扩展导致性能出现瓶颈--..这些都是运维工程师们的噩梦.怎样积极.有效地预防故障的发生?如何主动提高运维可靠性?在性能危机出现时,怎样化解?所有这些问题,在风云互联的"零感知"在线迁移解决方案中,都能找到答案. 在线迁移是什么? Live Migration (在线迁移)是指将一台虚拟机从其所在物理机无缝地转移到另一台物理机的过程. 哪些场景下会用到在线迁移? 场景一:  在物理机发生内核报错.CPU工作不正常等底层基础设施故障时,管理员可以将

基于jquery的bootstrap在线文本编辑器插件Summernote 简单强大

Summernote是一个基于jquery的bootstrap超级简单WYSIWYG在线编辑器.Summernote非常的轻量级,大小只有30KB,支持Safari,Chrome,Firefox.Opera.Internet Explorer 9 +(IE8支持即将到来). 特点: 世界上最好的WYSIWYG在线编辑器 极易安装 开源 自定义初化选项 支持快捷键 适用于各种后端程序言语 使用方法 使用html5文档 1 2 3 4 <!DOCTYPE html> <html> ..