论文笔记:Chaotic Invariants of Lagrangian Particle Trajectories for Anomaly Detection in Crowded Scenes

【原创】Liu_LongPo 转载请注明出处

【CSDN】http://blog.csdn.net/llp1992

最近在关注 crowd scene方面的东西,因为某些原因需要在crowd scene上实现 anomaly detection,所以看到了这篇论文,该论文是目前在crowd scene中进行abnormal detection做的最好的,记录下笔记当做学习资料。

传统的 anomaly detection中,很多突发事件监测都是基于motion information的,这样就忽略了由于appreance导致但是又没有造成 motion abnormal的情况下的漏监测。 比如卡车超重在桥上行走

传统的光流法,像素变化直方图,或者是背景差分法都很难应用于 crowd scenes ,因为此时的背景是 dynamic的。

也有将 motion 和 appreance 结合在一起进行abnormal detection的

在crowd scene中,很多一般的abnormal even detection方法都不能取得很好的效果,因为crowd scene的背景是经常剧烈变化的,传统的方法不能充分检测到这种变化。

关于Anomaly detection的,关注得不多,目前看到的方法有以下几种:

  • Social force model
  • Optical flow

social force model 主流的Optical flow方法有点不同,它主要是考虑crowd scene中的Froce,因此就没有Optical flow中的遮挡问题

该论文提出的方法也是基于 Optical flow的,能够适用于 coherent and incoherent scene,创新点如下:

  • 利用粒子轨迹对crowd scene进行建模,并提出具有代表性的trajectories 来对复杂的crowd flows进行建模
  • 在 crowd context 中引入 chaotic dynamics(混沌动力学),并通过调节一系列的 chaotic invariant feature来抽取 复杂的crowd motions 信息,这可以用来进行 anomaly detection
  • 提出一个概率框架来进行anomaly detection and localization

Significance of Crowd Scene Analysis

  • 管理大量人群在有限空间的聚集事件
  • 突发事件检测、定位以及警告
  • 集群监督,公共场所监控,安全控制等等

如下图,是不同密集层度的集群

challenge

  • 检测的人群目标密度非常大
  • 有多种运动目标的密集层度,如上图
  • 传统方法
    • 是适合在稀疏空间
    • 会受到严重遮挡,检测目标小,目标appreance类似的问题

另外,在crowd scene中,很多一般的abnormal even detection方法都不能取得很好的效果,因为crowd scene的背景是经常剧烈变化的,传统的方法不能充分检测到这种变化

论文的Idea

拉格朗日质点动力学 + 混沌不变量

  • 框架如下:

论文创新点

  • 目前唯一利用粒子轨迹聚类来对crowsed scene 进行建模
  • 在 crowd context中引入混沌不变量
  • 能够处理连贯和不连贯的人流

Particle Advection

其中,T 是视频帧,W 是视频帧的宽度, H 是视频帧的高度

Cluster Particle Trajectories

  • 原则:几条轨迹流可能只是有一个单一的运动目标产生
  • 方法:聚类
    • step1 : 去除那些相对运动量比较少的点或轨迹,因为它们包含的运动信息比较少
    • step2 : 根据轨迹流的位置信息进行K-means聚类
  • 输出:聚类后的代表性轨迹流

在step1中去除点或轨迹的标准是轨迹流的方差,设定阈值 ?, 去除那些方差比?小的轨迹流

var{(Xtw,Yth)}<?

轨迹流聚类后如下:

这些聚类后的轨迹流就是 representative trajectories。实验结果证明,突发事件检测基本上对cluster number不敏感

Chaotic Invariants

  • Representation of scenes: Representative trajectories
  • To identify the scene’s dynamics in terms of the dynamics of representative trajectories: lChaotic dynamics by measurable chaotic invariants

论文中说到,运用上面提取的 representative trajectories 可以创建一个基于 Chaotic Invariants 的模型,该模型能够 handle both coherent and incoherent scenes and offer a description using only two features

也就是两个Chaotic Invariants:largest Lyapunov exponent :L 和 correlation dimension:D。

此外,为了进行 anomaly detection,还增加了feature M,代表的是轨迹流 x 和 y 的平均坐标 M

对于 Chaotic Invariants,我个人不是很懂,理解得不太好。如果有懂得人还望不吝赐教。

Feature Set

由上面可知,本模型得到的特征集如下: F={L,D,M}

  • L: Largest Lyapunov exponent
  • D: Correlation dimension
  • M: Mean of representative trajectories (Only necessary for position-caused anomalies)

则求解 L 和 D 的过程如下:

求解过程还是挺好懂的,就是先找一条轨迹流的最邻近的轨迹流组成轨迹流pairs,然后进行求解L 和 D

Advantages of the Algorithm

  • Proven to be insensitive to the changes in time delay, embedding dimension, size of data set and to some extent noise
  • Ensure L>0 for condition of chaotic analysis

计算chaotic feature 时需要的特征比较多,因此本文在轨迹中插入一些点来达到每个事件序列都有500个点

Anomaly Detection

Definition of anomaly: Spatiotemporal change of scene/system dynamics (chaotic or/and positions)

  • Global anomaly: entire change of dynamics
  • Local anomaly: dynamics changes near particular spatial points
  • Approach: Probabilistic model

具体方法如下:

首先运用GMM算法描述正常场景的概率密度函数:

P(Γ|Φ)=∑k=1KwkN(Γ;uk,Σk)

其中:

Γ denotes a four (or six if M features are included) dimensional set of random variables with two features for each time series in x and y

K : 高斯元的个数

u : 均值

Σ : 方差

Φ : 模型参数

Model Learning

Normality model: Multi-variate GMM

  • Learning by: EM + IPRA algorithm
  • Principle for judging a query as normal or abnormal: Probability of the query belonging to the normality model + ML criterion

也就是,当我们用一些正常的视频序列 S 来训练模型P(Γ|Φ)=∑Kk=1wkN(Γ;uk,Σk),模型的输入每一个 representative trajectories,学习得到模型参数 Φm 后,就可以将测试视频流输入模型,对所有的representative trajectories输出的概率求平均值,根据最大似然准则(ML)将平均值与阈值 Lthres 比较判断测试视频是属于normal还是abnormal。

Anomaly Localization

1.计算每个representative trajectory 对于模型的输出概率

2.定位那些比阈值Lthres小的representative trajectory

3.根据位置信息对它们进行聚类得到多个cluster

4.去除那些包含少量trajectories的cluster

5.剩下的那些cluster就是主要的abnormal region

Experiment Results

举个栗子,下面两个图中,人工标记黄色框汇总有人站起来跳舞,其他人在鼓掌,跳舞的人就属于 abnormal 的。(其实只给一帧的图片我看不太出)

这是实验结果,中间的图是检测到的所有的abnormal region,右边是去除那些包含少量trajectories 的cluster后的情况,基本可以定位成功

关于 GMM和EM算法的资料:

http://blog.csdn.net/u012176591/article/details/46051431

K-means聚类和EM思想

http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html

(EM算法)The EM Algorithm :

http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006936.html

高斯混合模型(GMM) :

http://www.cnblogs.com/mindpuzzle/archive/2013/04/24/3036447.html

EM及高斯混合模型:

http://www.cnblogs.com/zhangchaoyang/articles/2624882.html

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-09 02:14:12

论文笔记:Chaotic Invariants of Lagrangian Particle Trajectories for Anomaly Detection in Crowded Scenes的相关文章

论文笔记之:From Facial Parts Responses to Face Detection: A Deep Learning Approach

From Facial Parts Responses to Face Detection: A Deep Learning Approach ICCV 2015

论文笔记(1)——《Where&#39;s Wally?Precise User Discovery Attacks in Location Proximity Services》

Abstract: 位置相近服务在社交和移动网络的广泛使用是基于可用性和用户隐私的平衡,但引发了三角定位攻击的风险.文章系统化地讨论了此类攻击的防范,包括问题在不同临近模型下的形式化,针对不同模型的有效攻击,以及攻击需要的询问次数的确界,并针对实际应用进行实验. 一)对攻击的建模:UDP,已知包含点p的欧氏平面区域A以及一个提供邻域信息的黑箱,找到点p的位置 邻域(proximity oracle)定义:,以某点为圆心的区域 原问题化为两部分: 1)Disk Coverage:将A用最少的r-邻

Kalman论文笔记

笔者前段时间阅读了一些关于Kalman的姿态论文,本想把Kalman的知识点也整理出来发布,无奈这编辑器不给力,太多的公式无法复制粘贴,图片格式上传的太复杂,就放弃了.因此笔者只发布Kalman的论文笔记,用表格的形式分析了几篇论文的Kalman filter的结构,希望对大家有帮助. 表格中包含有 论文名称 状态变量 转移矩阵 观测变量 观测矩阵 过程噪声 观测噪声 备注 百度网盘:pan.baidu.com/s/1kT1iC6r

DL4NLP —— 看图说话(Image Caption)任务的论文笔记(一)评价指标和NIC模型

看图说话(Image Caption)任务是结合CV和NLP两个领域的一种比较综合的任务,Image Caption模型的输入是一幅图像,输出是对该幅图像进行描述的一段文字.应用场景:比如说用户在拍了一张照片后,利用Image Caption技术可以为其匹配合适的文字,方便以后检索或省去用户手动配字:此外它还可以帮助视觉障碍者去理解图像内容.类似的任务还有Video Caption,输入是一段视频,输出是对视频的描述. (一)任务描述 目前来说,Image Caption任务主要集中在英文上,数

论文笔记 Deep Patch Learning for Weakly Supervised Object Classi cation and Discovery

Background 1) "Patch-level image representation"的优势 "Patch-level image representation is very important for object classification and detection, since it is robust to spatial transformation, scale variation, and cluttered background" &

Twitter 新一代流处理利器——Heron 论文笔记之Heron架构

Twitter 新一代流处理利器--Heron 论文笔记之Heron架构 标签(空格分隔): Streaming-process realtime-process Heron Architecture Heron 架构如下图: 用户编写发布topoloy到Aurora调度器.每一个topology都作为一个Aurora的job在运行.每一个job包括几个container,这些container由Aurora来分配和调度.第一个container作为Topology Master,其他的Cont

Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪,算是单目标跟踪中比较早的应用强化学习算法的一个工作.  在基于深度学习的方法中,想学习一个较好的 robust spatial and temporal representation for continuous video data 是非常困难的.  尽管最近的 CNN based tracke

【转】Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现

原作者:zouxy09 原文链接:http://blog.csdn.net/zouxy09/article/details/9993371 Deep Learning论文笔记之(四)CNN卷积神经网络推导和实现 [email protected] http://blog.csdn.net/zouxy09          自己平时看了一些论文,但老感觉看完过后就会慢慢的淡忘,某一天重新拾起来的时候又好像没有看过一样.所以想习惯地把一些感觉有用的论文中的知识点总结整理一下,一方面在整理过程中,自己

Staple: Complementary Learners for Real-Time Tracking 论文笔记

Staple: Complementary Learners for Real-Time Tracking 论文笔记  相关滤波相关的跟踪算法,最近非常的流行,对运动模糊和光照变换有一定的鲁棒性.但是,由于像模型展示的那样,他们的跟踪结果严重的依赖于跟踪物体的空间布局,对形变非常的敏感(deformation).基于颜色统计的模型有互补的性能:他们对物体的外形有较好的处理能力,但是,对出现的光照变量却无法很好的应对.此外,仅仅依赖于颜色统计,没有那么好的判别性.本文提出一种简单的跟踪算法,结合互