R-CNN论文翻译——用于精确物体定位和语义分割的丰富特征层次结构

原文地址

我对深度学习应用于物体检测的开山之作R-CNN的论文进行了主要部分的翻译工作，R-CNN通过引入CNN让物体检测的性能水平上升了一个档次，但该文的想法比较自然原始，估计作者在写作的过程中已经意识到这个问题，所以文中也对未来的改进提出了些许的想法，未来我将继续翻译SPPNet、fast-RCNN、faster-RCNN、mask-RCNN等一系列物体定位和语义分割领域的重要论文，主要作者都是Ross Girshick和Kaiming He。

用于精确物体定位和语义分割的丰富特征层次结构

Rich feature hierarchies for accurate object detection and semantic segmentation

Ross Girshick Jeff Donahue Trevor Darrell Jitendra Malik

UC Berkeley

摘要

过去几年，在权威的PASCAL VOC数据集上，物体定位的性能已经达到一个稳定水平。表现最好的方法都是融合了多个低层次图像特征和高层次的上下文环境的复杂系统。本文提出一种简单的可扩展的检测算法，可以将VOC2012上期望平均精度的最好结果明显提升30%以上——达到了53.3%。我们的方法结合了两个关键因素：(1) 将大型卷积神经网络（CNNs）应用于自底向上区域推荐以定位和分割物体；（2）当标签训练数据不足时，先针对辅助任务进行有监督预训练，再进行特定任务的调优，就可以产生明显的性能提升。由于我们结合了区域推荐和CNNs，该方法被称为R-CNN：Regions with CNN features。我们对比了R-CNN和OverFeat，Overfeat是最近被提出的一个机遇类CNN架构的滑动窗口检测器，发现R-CNN在ILSVRC2013检测数据集上面的表现明显优于OverFeat。整个系统的源码在：https://people.eecs.berkeley.edu/~rbg/rcnn（译者注：已失效，新地址：https://github.com/rbgirshick/rcnn）。

继续阅读(最佳阅读体验)

时间： 2024-10-09 00:29:39

R-CNN论文翻译——用于精确物体定位和语义分割的丰富特征层次结构

用于精确物体定位和语义分割的丰富特征层次结构

Rich feature hierarchies for accurate object detection and semantic segmentation

摘要

R-CNN论文翻译——用于精确物体定位和语义分割的丰富特征层次结构的相关文章

RCNN论文翻译

论文翻译：XNOR-Net: ImageNet Classification Using BinaryConvolutional Neural Networks

Mesh R-CNN 论文翻译（原理部分）

【论文翻译】SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

[Berkeley]弹性分布式数据集RDD的介绍（RDD: A Fault-Tolerant Abstraction for In-Memory Cluster Computing 论文翻译）

Fully Convolutional Networks for semantic Segmentation（深度学习经典论文翻译）

深度学习论文翻译解析（一）：YOLOv3: An Incremental Improvement

Single Shot MultiBox Detector论文翻译【修改】

分布式系统领域经典论文翻译集