【模式识别】MPL,MIL和MCL

Multi-Instance Learning (MIL) 和Multi-Pose Learning (MPL)是CV的大牛Boris Babenko at UC San Diego提出来的,其思想可以用下面一幅图概况。MIL是指一个对象的学习实例可能有很多种情况,学习的时候不是用一个精确的标注对象来学习,而是用一个对象的多个实例组成的“包”来学习;而MPL是指一个对象会有多个姿态(Pose),学习的时候用一个分类器常常难以达到很好的效果,所以可以训练多个分类器来分别学习不同的Pose。其描述的都是对一个对象多种情况的同时学习和对齐的策略,也就是MIL是“adjusting training samples so they lie in correspondence”,而MPL是“separating the data into coherent groups and training separate classifiers for each”。

上图中右边为MIL的学习情况,每一行为一个对象的学习数据;左边为MPL的学习情况,每行为一个对象的不同pose学习数据,而每种颜色的框为训练的一个class。MIL被提出以后应用很广,而貌似MPL只有为数不多的引用,一篇《Multi-Cue Onboard Pedestrian Detection》应用的MPL但也没有具体的公式。MPL与传统的Boost方法的不同就是使用如下组合的y代替传统的y,其中k表示多个class,也就是有一个class识别为1,则判断结果为1。

其迭代训练的步骤也是大致相同,除了复杂度上多一个层每个yk的训练,另外相应的更新公式也不同:

之后剑桥提出Multi-Class Learning (MCL),也是训练多个class,除了不是用的max(yk)而是用的诸如下面:

Noisy-OR的概率模型,整体思想感觉和MPL是一样的。但MCL的迭代更新方法写的要明朗许多,其权重wki(k表示每个class,i表示样本)更新使用如下方法:

注意P二类模型中常用的-1~1,而是0~1,所以当某个class判断为一定不是此类的时候,此样本在下一次的训练中就会被去掉,而相应的判断为是的class中权重加大。而在具体的某一类k的class中,判断错误的样本权重会相应加大,这点又契合了传统的Boost训练方法。MCL的文章是用在数据分类上边:

效果看上去很美味~

参考文献:

[1] Boris Babenko, Piotr Doll′ar, Zhuowen Tu, Serge Belongie. Simultaneous Learning and Alignment: Multi-Instance and Multi-Pose Learning.

[2] Christian Wojek, Stefan Walk, Bernt Schiele. Multi-Cue Onboard Pedestrian Detection

[3] Tae-Kyun Kim, Roberto Cipolla. MCBoost: Multiple Classifier Boosting for Perceptual Co-clustering of Images and Visual Features

(转载请注明作者和出处:http://blog.csdn.net/xiaowei_cqu 未经允许请勿用于商业用途)

【模式识别】MPL,MIL和MCL

时间: 2024-10-17 11:59:56

【模式识别】MPL,MIL和MCL的相关文章

7.1-7.31推荐文章汇总

7.1-7.31推荐文章汇总 [移动开发] Android ActionBar应用实战.高仿微信主界面的设计        guolin Cocos2d-x-Lua 开发简单的小游戏(记数字踩白块)        IT_xiao小巫 是男人就下100层[第四层]--Crazy贪吃蛇(1)        阳光小强 SEAndroid安全机制框架分析        罗升阳 Android多线程分析之四:MessageQueue的实现        飘飘白云 美女图片採集器 (源代码+解析)     

模式识别 - 处理多示例学习(MIL)特征(matlab)

处理多示例学习(MIL)特征(matlab) 本文地址: http://blog.csdn.net/caroline_wendy/article/details/27206325 多示例学习(MIL)的特征(features)包含, "示例编号+视频编号+标签+特征"的形式; 需要组成多示例学习特定包的形式, 每一个元胞是一个多示例包, 后面一位是标签, 即"特征包+标签"的形式; 代码: %author @ C.L.Wang %time @ 2014.5.27 %

随时更新———个人喜欢的关于模式识别、机器学习、推荐系统、图像特征、深度学习、数值计算、目标跟踪等方面个人主页及博客

目标检測.识别.分类.特征点的提取 David Lowe:Sift算法的发明者,天才. Rob Hess:sift的源代码OpenSift的作者,个人主页上有openSift的下载链接.Opencv中sift的实现.也是參考这个. Koen van de Sande:作者给出了sift,densesift,colorsift等等经常使用的特征点程序.输出格式见个人主页说明,当然这个特征点的算法,在Opencv中都有实现. Ivan Laptev:作者给出了物体检測等方面丰富C\C++源代码,及部

模式识别——特征提取

Pattern Classification 如何从模式样本中提取和提取最能解决问题的 模式特征 模式采集中所得到的样本测量值往往是很多的,比如说点云 无论是理论上还是实践中数据压缩都是很重要的 原始特征--数据采集得到的诸测量值 维数压缩 R->d  保持本质属性不变 通过特征变换:相似变换.旋转变换.正交变换... 通过特征选择:从特征集中选取出最有利于分类的特征子集 特征变换与特征选择,作为两个过程,先后次序不固定,视情况而定 应该在处理时间和分类错误率之间进行折中 图像的特征提取 一幅图

模式识别:非参数估计法之Parzen窗估计和k最近邻估计

本实验的目的是学习Parzen窗估计和k最近邻估计方法.在之前的模式识别研究中,我们假设概率密度函数的参数形式已知,即判别函数J(.)的参数是已知的.本节使用非参数化的方法来处理任意形式的概率分布而不必事先考虑概率密度的参数形式.在模式识别中有躲在令人感兴趣的非参数化方法,Parzen窗估计和k最近邻估计就是两种经典的估计法. 参考书籍:<模式分类> 作者:RichardO.Duda,PeterE.Hart,DavidG.Stork 一.基本原理 1.非参数化概率密度的估计 对于未知概率密度函

模式识别概论

以下的整理来自刘老师模式识别讲义,讲述模式识别概念.方法.评价等 1 什么是模式 2 什么是模式识别 3 模式识别 机器学习 数据挖掘的关系 4 模式识别方法分类 5 学习方法分类 6 模式识别系统设计评价过程 7 分类器性能评价方法   8 性能评价准则 完

模式识别 - 有害视频检測程序的策略

有害视频检測程序的策略 本文地址: http://blog.csdn.net/caroline_wendy/article/details/26346831 有害(色情\恐怖\暴力)视频, 严重危害网络的健康, 须要进行检測和过滤. 检測色情\恐怖视频, 通过检測程序, 检測出多个场景的概率, 然后进行排序, 当场景多余6个时, 仅仅取最大的6个场景; 返回的概率值是前3个最大检測值场景的概率的均值; 色情\恐怖汇总时, 首先检測色情, 假设为色情视频, 则不进行恐怖的检測, 否则继续检測恐怖,

句法模式识别(一)-串文法

前面介绍的所有思想都属于统计模式识别,然而统计模式识别存在2个问题: 1.有的模式结构很复杂,不能用一个矢量来表示. 2.有的模式识别任务中,我们更关心如何描述它的结构特征. 因此需要另外一种模式识别:结构模式识别. 这其中,句法模式识别主要使用形式语言来描述模式结构,在理论上完备,表1是句法模式识别与统计模式识别的对应关系,下面做介绍. 表1 串文法就是一种机器能识别的语法,所以先讲讲语法. 字母表V 字母a,b,c的有限集合. 句子x,y,z V中的符号形成的有限长度的字符串. 这其中是V的

常用牛人主页链接(计算机视觉、模式识别、机器学习相关方向,陆续更新。。。。)【转】

转自:http://blog.csdn.net/goodshot/article/details/53214935 目录(?)[-] The Kalman Filter 介绍卡尔曼滤波器的终极网页 Navneet DalalHistograms of Oriented Gradients for Human Detection 牛人主页(主页有很多论文代码) Serge Belongie at UC San Diego Antonio Torralba at MIT Alexei Ffros a