论文的链接:http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Shao_Deeply_Learned_Attributes_2015_CVPR_paper.pdf
这篇文章是通过 Attribute对Crowd Scene的Video进行理解, 并利用CNN学习描述属性的特征。
文章的主要贡献:
1. 构建一个新的大规模WWW Crowd的数据集(8257个场景,10000个视频), 并定于了94种属性
2. 构建CNN模型学习Deep Features
属性的定义
属性主要是基于三个方面: Where, Who, Why
CNN模型
Motion是 根据2014-CVPR-Scene-independent group profiling in crowd这篇论文计算得到。
实验
从结果中大概可以得到Appearance的准确率比Motion要高,两者结合其实影响不大。
时间: 2024-11-17 14:34:39