论文: Feature Pyramid Networks for Object Detection

论文阅读: Feature Pyramid Networks for Object Detection

Feature Pyramid 是提取图像特征领域的很重要的概念。在深度学习领域没有被提及是因为目前深度学习仍然受到计算量的限制。

本论文根据不同的feature maps给出了 Feature Pyramid Network,因为 Featrue Pyramid的尺度不变性,可以有效的解决Object Detection 中的目标物体不一致大小的问题。 熟悉图像处理的都知道 sift 算法,其中 sift 的Pyramid很好的解决了 multi-scale 的问题。

从上图可以看出, fpn 充分提取了多个layer的feature maps的特征。针对每一个{p2, p3, p4},都进行一个prediction。high-resolution 的featrue map有着 low-level 的featrue ,这些featrue的表达能力稍微弱点。

本paper的亮点就是将low-resolution,semantically strong feature的feature map和 high-resolution,weak featrue的feature map 通过 top-down pathway 和 lateral connections结合起来。 使得每一个feature Pyramid 都含有丰富的,all-level的sematics。

整个fpn包含三个部分 bottom-up pathway, top-down pathway 和 lateral connection。

bottom-up pathway 就是典型的Network的forward, paper采用的是resnet的(last residual block)不同stage的最后一层concatenate layer作为 reference layer。其中的 {C2,C3, C4, C5} 对应的是Conv2, Conv3, Conv4 和 Conv5的output。

top-down pathway采用的是upsample method, 进行 2x Up 的操作,使得后面的feature map upsample 到和前一阶段的 feature map有着相同的size。 对于low-level的feature map,因为其lower level 的semantic,subsample的次数更少,它的activation也更加精确地localized。

lateral connection的作用是使用 1x1的Conv对low-level的featrue map进行降低维度,使得维度跟后一层top-down下来的feature map的维度一致,从而做element-wise addition。

应用:
用在 RPN, 可以提取多个维度的feature map的anchor,增加了feature的表达。

用在Fast RCNN,就是将 ROI 打在不同scale的Pyramid level上,最后统一roi-pooling到特定的scale,做CNN classification。 并且给出了经验值挑选方式:

论文的关键点: 引入Pyramid,同时保证整个Network的计算增量尽可能小。增强feature representation。

时间: 2024-07-28 19:55:32

论文: Feature Pyramid Networks for Object Detection的相关文章

【Network Architecture】Feature Pyramid Networks for Object Detection(FPN)论文解析(转)

目录 0. 前言 1. 博客一 2.. 博客二 0. 前言 ??这篇论文提出了一种新的特征融合方式来解决多尺度问题, 感觉挺有创新性的, 如果需要与其他网络进行拼接,还是需要再回到原文看一下细节.这里转了两篇比较好的博客作为备忘. 1. 博客一 这篇论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,特来分享. 论文:feature pyramid networks for object detection 论文链接:https://arxiv.org/abs/1612.031

论文阅读 | FPN:Feature Pyramid Networks for Object Detection

论文地址:https://arxiv.org/pdf/1612.03144v2.pdf 代码地址:https://github.com/unsky/FPN 概述 FPN是FAIR发表在CVPR 2017上的一篇文章,采用特征金字塔的方法进行目标检测.文中利用深层卷积网络固有的多尺度金字塔层次结构,高效地构造特征金字塔.文章提出了FPN--一种具有横向连接的自顶向下的结构,来构建所有尺度上的高级语义特征映射. 网络结构 下图展示了几种不同的利用特征的方式:(a)为图像金字塔,就是对图像resize

Parallel Feature Pyramid Network for Object Detection

ECCV2018 总结: 文章借鉴了SPP的思想并通过MSCA(multi-scale context aggregation)模块进行特征融合从而提出PFPNet(Parallel Feature Pyramid Network)算法来提升目标检测的效果. 1.使用spp模块通过扩大网络宽度而不是增加深度来生成金字塔形特征图 2.提出msca模块,有效地结合了大不相同规模的上下文信息 3.效果好:82.3% (Pascal VOC 2007), 80.3% (PASCAL VOC 2012),

FPN(feature pyramid networks)算法讲解

FPN(feature pyramid networks)算法讲解 https://blog.csdn.net/u014380165/article/details/72890275 这篇论文是CVPR2017年的文章,采用特征金字塔做目标检测,有许多亮点,特来分享. 论文:feature pyramid networks for object detection 论文链接:https://arxiv.org/abs/1612.03144 论文概述: 作者提出的多尺度的object detect

Rich feature hierarchies for accurate object detection and semantic segmentation

一.主要思想 本文的主要思想首先采用Selective Search for Object Recognition论文的方法对每张图像分块得到多个个Region proposals,然后对每个Region proposal提取CNN特征,在采用线性svm进行分类,在VOC2012上面达到了 53.3%的mAP. 二.Object detection with R-CNN 1.模型框架 (1)获取Region proposals 采用Selective Search for Object Reco

论文解读1——Rich feature hierarchies for accurate object detection and semantic segmentation

背景 在2012 Imagenet LSVRC比赛中,Alexnet以15.3%的top-5 错误率轻松拔得头筹(第二名top-5错误率为26.2%).由此,ConvNet的潜力受到广泛认可,一炮而红.既然convNet在图像分类任务上能取得好成绩,是不是也能放到目标检测任务上呢.本文就是用convNet解决目标检测任务的首次探索.在PASCAL VOC 2010上的mAP达到了53.7%. 方法 模型一共分为三个模块. (1)region proposals(区域推荐)).在一张整图上面产生很

Rich feature hierarchies for accurate object detection and semantic segmentation(理解)

0 - 背景 该论文是2014年CVPR的经典论文,其提出的模型称为R-CNN(Regions with Convolutional Neural Network Features),曾经是物体检测领域的state-of-art模型. 1 - 相关知识补充 1.1 - Selective Search 该算法用来产生粗选的regions区域,在我的另一篇博文Selective Search for Object Recognition(理解)中进行详细讲解. 1.2 - 无监督预训练&有监督预训

论文阅读 | ExtremeNet:Bottom-up Object Detection by Grouping Extreme and Center Points

相关链接 论文地址:https://arxiv.org/abs/1901.08043 论文代码:https://github.com/xingyizhou/ExtremeNet 概述 ExtremeNet是今年(2019)1月23号挂在arxiv上的目标检测论文,是至今为止检测效果最好的单阶段目标检测算法.思想借鉴CornerNet,使用标准的关键点估计网络检测目标关键点进而构造目标的预测框.ExtremeNet预测四个extreme point(顶.左.底.右)以及目标的中心点,如果这五个点满

【论文笔记】Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks

写在前面: 我看的paper大多为Computer Vision.Deep Learning相关的paper,现在基本也处于入门阶段,一些理解可能不太正确.说到底,小女子才疏学浅,如果有错误及理解不透彻的地方,欢迎各位大神批评指正! E-mail:[email protected]. ------------------------------------------------ <Faster R-CNN: Towards Real-Time Object Detection with Reg