Histograms of Sparse Codes for Object Detection用于目标检测的稀疏码直方图

Abstract
Object detection has seen huge progress in recent years, much thanks to the heavily-engineered Histograms of Oriented Gradients (HOG) features. Can we go beyond gradients and do better than HOG? We provide an affirmative answer by proposing and investigating a sparse representation for object detection, Histograms of Sparse Codes (HSC).We compute sparse codes with dictionaries learned from data using K-SVD, and aggregate per-pixel sparse codes to form local histograms. We intentionally keep true to the sliding window framework (with mixtures and parts) and only change the underlying features. To keep training (and testing) efficient, we apply dimension reduction by computing SVD on learned models, and adopt supervised training where latent positions of roots and parts are given externally e.g. from a HOG-based detector. By learning and using local representations that are much more expressive than gradients, we demonstrate large improvements over the state of the art on the PASCAL benchmark for both rootonly and part-based models.

原文地址:https://www.cnblogs.com/2008nmj/p/11684158.html

时间: 2024-10-06 15:42:35

Histograms of Sparse Codes for Object Detection用于目标检测的稀疏码直方图的相关文章

BING: Binarized Normed Gradients特征用于目标检测<阅读笔记1>

作者观察到,一般的物体,当归一化到某一个小的尺度上时,目标都有一个很好的了轮廓共 性.也就是目标的边缘梯度比较明显,组合成为一个闭合的轮廓.这里指的目标是广义的, 可以是任何类别的物体.(论文结论成立的依据) 图a.表示原图像,图b表示梯度图像, 然后作者缩放到了很多尺度,图c,是 将梯度图像缩放到8x8以后,正例和负 例显示的结果,图d是将64位向量作为 特征,使用线性SVM训练得到的一个权 重系数图.其中,图a中红色的框表示 目标,绿色的框表示非目标 特征提取BING 1. 使用1-D的模板

中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks

R-FCN: Object Detection via Region-based Fully Convolutional Networks 摘要 我们提出了基于区域的全卷积网络,以实现准确和高效的目标检测.与先前的基于区域的检测器(如Fast/Faster R-CNN [6,18])相比,这些检测器应用昂贵的每个区域子网络数百次,我们的基于区域的检测器是全卷积的,几乎所有计算都在整张图像上共享.为了实现这一目标,我们提出了位置敏感分数图,以解决图像分类中的平移不变性与目标检测中的平移变化之间的困

Google Object detection配置与使用

Google Object detection 前言: 本文记录了使用Google发布的Object detection(July 1st, 2019)接口,完成了对标注目标的检测.参考了很多博文,在此记录配置过程,方便之后的再次调用. 首先贴出完整的代码地址:https://github.com/tensorflow/models Tensorflow Object Detection API:https://github.com/tensorflow/models/tree/master/r

Rich feature hierarchies for accurate object detection and semantic segmentation(理解)

0 - 背景 该论文是2014年CVPR的经典论文,其提出的模型称为R-CNN(Regions with Convolutional Neural Network Features),曾经是物体检测领域的state-of-art模型. 1 - 相关知识补充 1.1 - Selective Search 该算法用来产生粗选的regions区域,在我的另一篇博文Selective Search for Object Recognition(理解)中进行详细讲解. 1.2 - 无监督预训练&有监督预训

Progressive Sparse Local Attention for Video object detection

motivation: 之前使用flownet的方法有诸多弊端. 1.在检测框架中加入光流网络极大地增加了检测器模型的参数,无法用在移动端. 2.光流原本是描述两张图片间像素点的位移的,直接将其用在high-level的feature map上会引入人为的干扰.特别的,high-level的feature map上的像素点移动一格,对应的图片上可能存在10-20个像素点的位移,光流估计大位移容易出错. 因此本文舍弃了光流网络,提出了一个叫做Progressive Sparse Local Att

Histograms of Oriented Gradients for Human Detection

Histograms of Oriented Gradients for Human Detection 本文是论文笔记. 转载注明:http://blog.csdn.net/stdcoutzyx/article/details/40299383 Hog算子进行行人检测,是05年在CVPR上发表的经典文章.使用Hog算子提取特征,然后使用SVM来进行分类. 1. Definition Hog Descriptor:locally normalized histogram of gradient

CV:object detection(Haar)

一. Haar分类器的前世今生 人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来. 目前的人脸检测方法主要有两大类:基于知识和基于统计. "基于知识的方法主要利用先验知识将人脸看作器官特征的组合,根据眼睛.眉毛.嘴巴.鼻子等器官的特征以及相互之间的几何位置关系来检测人脸.基于统计的方法则将人脸看作一个整体的模式--二维像素矩阵,从统计的观点通过大量人脸图像样本构造人脸模

CV:object detection(LBP)

LBP(Local Binary Pattern,局部二值模式)是一种用来描述图像局部纹理特征的算子:它具有旋转不变性和灰度不变性等显著的优点.它是首先由T. Ojala, M.Pietik?inen, 和 D. Harwood 在1994年提出,用于纹理特征提取.而且,提取的特征是图像的局部的纹理特征: 1.LBP特征的描述 原始的LBP算子定义为在3*3的窗口内,以窗口中心像素为阈值,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0.这样

论文阅读(Chenyi Chen——【ACCV2016】R-CNN for Small Object Detection)

Chenyi Chen--[ACCV2016]R-CNN for Small Object Detection 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 总结与收获点 参考文献 作者和相关链接 论文下载 Chenyi Chen , Ming-Yu Liu, Jianxiong Xiao 所有作者的简单信息 方法概括 这篇文章主要讨论针对小目标的目标检测 文章为了证明:对传统的R-CNN style的方法进行改进,可以用于小目标检测,并且性能比DPM方法好 整个检测流程: