阅读detection

关于detecion的几篇文章,感觉有必要系统学习一下,并记录一下了,最近看书比较多,文章看得少,赶紧看看吧。

FPN:Feature Pyramid Networks for Object Detection  作者阵营可以去看看,不在这里贴了,免得吓着大家。前一篇MASK R-CNN就吓到我自己了,这篇是MASK r-cnn的前一篇吧,mask rcnn就是基于这个做的,取得的效果那么高,也有很大一部分是FPN的功劳吧,所以比起来FPN更有价值。

同时出现的一篇类似工作,Beyond Skip Connections: Top-Down Modulation for Object Detection,Google的工作。对他们的工作,其实我觉得好像他们不是特别想公开一样,之前他们的工作其实很早出来,但是因为代码不公开,而且因为写的有点不清晰,很多细节真的感觉猜不透,有些还有矛盾,所以感觉关注度不高吧。其实multibox的工作,就是SSD的前身啊,可是关注度不高啊,至少没有那么高。

还有一篇关于GAN应用在detection上的工作,A-Fast-RCNN: Hard positive generation via adversary for object detection,CVPR17的工作。

还有一篇improved WGAN,Improved Training of Wasserstein GANs,比WGAN训练更稳定更容易收敛。

写大概写一个提纲,后面再详细分析。

时间: 2024-08-02 04:33:58

阅读detection的相关文章

论文阅读--Scalable Object Detection using Deep Neural Networks

Scalable Object Detection using Deep Neural Networks 作者: Dumitru Erhan, Christian Szegedy, Alexander Toshev, and Dragomir Anguelov 引用: Erhan, Dumitru, et al. "Scalable object detection using deep neural networks." Proceedings of the IEEE Confere

论文阅读 | FCOS: Fully Convolutional One-Stage Object Detection

论文阅读——FCOS: Fully Convolutional One-Stage Object Detection 概述 目前anchor-free大热,从DenseBoxes到CornerNet.ExtremeNet,以及最近的FSAF.FoveaBox,避免了复杂的超参数设计,而且具有很好的检测效果.本文作者提出了一种全卷积的单阶段目标检测算法,类似于语义分割的做法使用像素级预测.该检测框架简单有效,而且可以方便地用于其他任务. 简介 再啰嗦一下基于anchor的检测算法的缺陷: 1.检测

论文阅读:Adaptive NMS: Refining Pedestrian Detection in a Crowd

论文阅读:Adaptive NMS: Refining Pedestrian Detection in a Crowd 2019年04月11日 23:08:02 Kivee123 阅读数 836 版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/qq_37014750/article/details/89222334 Adaptive-NMS(CVPR 2019) 文章  又是一篇在NMS上

论文阅读(Chenyi Chen——【ACCV2016】R-CNN for Small Object Detection)

Chenyi Chen--[ACCV2016]R-CNN for Small Object Detection 目录 作者和相关链接 方法概括 创新点和贡献 方法细节 实验结果 总结与收获点 参考文献 作者和相关链接 论文下载 Chenyi Chen , Ming-Yu Liu, Jianxiong Xiao 所有作者的简单信息 方法概括 这篇文章主要讨论针对小目标的目标检测 文章为了证明:对传统的R-CNN style的方法进行改进,可以用于小目标检测,并且性能比DPM方法好 整个检测流程:

论文阅读(BaiXiang——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks)

BaiXiang--[CVPR2016]Multi-Oriented Text Detection with Fully Convolutional Networks 目录 作者和相关链接 方法概括 方法细节 创新点和贡献 实验结果 问题讨论 总结与收获点 作者和相关链接 作者: paper下载 方法概括 Step 1--文本块检测: 先利用text-block FCN得到salient map,再对salient map进行连通分量分析得到text block: Step 2--文本线形成:

【CV论文阅读】+【搬运工】LocNet: Improving Localization Accuracy for Object Detection + A Theoretical analysis of feature pooling in Visual Recognition

论文的关注点在于如何提高bounding box的定位,使用的是概率的预测形式,模型的基础是region proposal.论文提出一个locNet的深度网络,不在依赖于回归方程.论文中提到locnet可以很容易与现有的detection系统结合,但我困惑的是(1)它们的训练的方法,这点论文中没有明确的提到,而仅仅说用迭代的方法进行(2)到底两者的融合后两个网络的结构是怎样呢?可以看做一个多任务的系统,还是存在两个网络呢? 检测方法 输入的候选bounding box(使用selective s

ACCV2004 Salient Region Detection 论文阅读

Salient Region Detection using Weighted Feature Maps based on the Human Visual Attention Model 主要是根据不同的feature maps的自身特点来计算这个map的权重. Itti等人提出了一个基于human visual attention 的模型,来检测一副图像里的显著区域,分为颜色对比.灰度.方向的特征来分别检测显著性,最后合成一幅显著性图.合成的方法有supervised learning, n

论文阅读之:Is Faster R-CNN Doing Well for Pedestrian Detection?

Is Faster R-CNN Doing Well for Pedestrian Detection? ECCV 2016   Liliang Zhang & Kaiming He 原文链接:http://arxiv.org/pdf/1607.07032v2.pdf 摘要:行人检测被人 argue 说是特定课题,而不是general 的物体检测.虽然最近的深度物体检测方法 如: Fast/Faster RCNN 在general 的物体检测中,展现了强大的性能,但是对于行人检测却不太成功.本文

论文阅读:Frequency-tuned Salient Region Detection

Frequency-tuned Salient Region Detection 作者发现,大部分方法产生的saliency map都不适合image segmentation.因为它们产生的saliency map分辨率低,物体边界不清楚,不能uniformly highlight 显著物体.这是由于向下采样让图像的频谱范围变窄了.为了解决这个问题,作者提出了对算法的五个要求,提出了一个适合做image segmentation 的saliency detector.五个要求是:着重强调最大的