2015-CVPR-Deeply Learned Attributes for Crowed Scene Understanding

论文的链接:http://www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Shao_Deeply_Learned_Attributes_2015_CVPR_paper.pdf

这篇文章是通过 Attribute对Crowd Scene的Video进行理解, 并利用CNN学习描述属性的特征。

文章的主要贡献:

1. 构建一个新的大规模WWW Crowd的数据集(8257个场景,10000个视频), 并定于了94种属性

2. 构建CNN模型学习Deep Features

属性的定义

属性主要是基于三个方面: Where, Who, Why

CNN模型

Motion是 根据2014-CVPR-Scene-independent group profiling in crowd这篇论文计算得到。

实验

从结果中大概可以得到Appearance的准确率比Motion要高,两者结合其实影响不大。

时间: 2024-11-17 14:34:39

2015-CVPR-Deeply Learned Attributes for Crowed Scene Understanding的相关文章

Convolutional Patch Networks with Spatial Prior for Road Detection and Urban Scene Understanding

Convolutional Patch Networks with Spatial Prior for Road Detection and Urban Scene Understanding 深度学习思想越来越火,在今年的CVPR 2015 文章中相关文章就有20多篇,可见是非常火的.最近在做关于语义分割和场景解析的内容,看到这篇文章后也是非常高兴. CN24 is a complete semantic segmentation framework using fully convoluti

Large-scale Scene Understanding (LSUN)

Large-scale Scene Understanding (LSUN) http://sunw.csail.mit.edu/ 下载数据了,还没来得及用呢,没想好怎么用,数据也没看,因为是lmdb格式的,不能直接看.

计算机视觉、机器学习等开源库网站链接

http://rogerioferis.com/VisualRecognitionAndSearch2014/Resources.html http://www.cnblogs.com/einyboy/p/3594432.html 持续跟新 可以看看这个 http://blog.csdn.net/workerwu/article/details/46537849 场景识别: SegNet: A Deep Convolutional Encoder-Decoder Architecture for

CVPR 2015 papers

CVPR2015 Papers震撼来袭! CVPR 2015的文章可以下载了,如果链接无法下载,可以在Google上通过搜索paper名字下载(友情提示:可以使用filetype:pdf命令). Going Deeper With ConvolutionsChristian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke

CVPR 2017 Paper list

CVPR2017 paper list Machine Learning 1 Spotlight 1-1A Exclusivity-Consistency Regularized Multi-View Subspace Clustering Xiaojie Guo, Xiaobo Wang, Zhen Lei, Changqing Zhang, Stan Z. Li Borrowing Treasures From the Wealthy: Deep Transfer Learning Thro

RNN and LSTM saliency Predection Scene Label

http://handong1587.github.io/deep_learning/2015/10/09/rnn-and-lstm.html  //RNN and LSTM http://handong1587.github.io/deep_learning/2015/10/09/saliency-prediction.html //saliency Predection http://handong1587.github.io/deep_learning/2015/10/09/scene-l

Awesome Deep Vision

Awesome Deep Vision  A curated list of deep learning resources for computer vision, inspired by awesome-php and awesome-computer-vision. Maintainers - Jiwon Kim, Heesoo Myeong, Myungsub Choi, Jung Kwon Lee, Taeksoo Kim We are looking for a maintainer

【王晓刚】深度学习在图像识别中的研究进展与展望

深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计算机视觉.图像与视频分析.多媒体等诸多领域都取得了巨大成功.本文将重点介绍深度学习在物体识别.物体检测.视频分析的最新研究进展,并探讨其发展趋势. 1. 深度学习发展历史的回顾 现有的深度学习模型属于神经网络.神经网络的历史可追述到上世纪四十年代,曾经在八九十年代流行.神经网络试图通过模拟大脑认知的机理,解决各种机器学习的问题.1986 年Rumelhart,Hinton 和Williams 在<自然>发表了著

Generative Adversarial Nets[pix2pix]

本文来自<Image-to-Image Translation with Conditional Adversarial Networks>,是Phillip Isola与朱俊彦等人的作品,时间线为2016年11月. 作者调研了条件对抗网络,将其作为一种通用的解决image-to-image变换方法.这些网络不止用来学习从输入图像到输出图像的映射,同时学习一个loss函数去训练这个映射.这让传统需要各种不同loss函数的问题变成了可以采用统一方法来解决成为可能.作者发现这种方法在基于标签map