目标检测论文解读12——RetinaNet

引言

　　这篇论文深刻分析了one-stage的模型精度比two-stage更差的原因，并提出Focal Loss提高精度。

思路

　　在论文中，作者指出，造成one-stage模型精度差的原因主要是：正负样本极不平衡。一张图片只有那么几个目标，但是用来分类的Anchor Box却能达到几千个，大量的样本都是负样本，而且大多数负样本都是容易分类的简单样本，这些简单样本的loss虽然低但是凭借着数量众多，能对loss有很大的贡献。因此分类器只用无脑判负也能达到不错的效果。

　　作者提出的Focal Loss能很好减少简单样本对梯度的影响。

　　相比于传统的CE(Pt)=-log(Pt)（这里Pt代表正负样本预测正确的可能性），Focal Loss在前面乘了一项(1-Pt)^r。

　　为什么多了这一项就能减少简单样本对梯度的影响呢？

　　可以看到，Pt越接近1表示这个样本预测正确的可能性越大，也就是这个样本越简单。而(1-Pt)^r这一项，显然是随着Pt的升高而减小，也就是样本越简单，Pt越小，Focal Loss整体的值也越小。这样就能减少简单样本对梯度的影响了。

　　

　　

　　

　　

原文地址：https://www.cnblogs.com/xin1998/p/11395933.html

时间： 2024-11-05 19:45:06

目标检测论文解读12——RetinaNet的相关文章

目标检测论文解读5——YOLO v1

背景之前热门的目标检测方法都是two stage的,即分为region proposal和classification两个阶段,本文是对one stage方法的初次探索. 方法首先看一下模型的网络结构,输入的原图片,经过24个卷积层提取特征,全连接层输出一个7*7*30的tensor,这个tensor里面就包含我们预测的结果了. 那么这个7*7*30的tensor包含哪些信息呢? 首先,7*7可以映射到448*448的原图片中,得到7*7个64*64的grid cell,对于原图中的每一个目

目标检测论文解读2——Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

背景用ConvNet方法解决图像分类.检测问题成为热潮,但这些方法都需要先把图片resize到固定的w*h,再丢进网络里,图片经过resize可能会丢失一些信息.论文作者发明了SPP pooling(空间金字塔池化)层,让网络可以接受任意size的输入. 方法首先思考一个问题,为什么ConvNet需要一个固定size的图片作为输入,我们知道,Conv层只需要channel固定(彩色图片3,灰度图1),但可以接受任意w*h的输入,当然输出的w*h也会跟着变化:然而,后面的FC层却需要固定长度的

目标检测论文解读7——YOLO v2

背景 YOLO v1检测效果不好,且无法应用于检测密集物体. 方法 YOLO v2是在YOLO v1的基础上,做出如下改进. (1)引入很火的Batch Normalization,提高mAP和训练速度: (2)加入了Anchor Box机制,每个grid cell5个Anchor Box: (3)自动选择Anchor Box,这是作者所作出的创新,之前Anchor Box都是人为直接规定的,显然不是很合理.作者通过K-means聚类算法,用IoU作为距离度量,生成了Anchor Box的尺度.

目标检测论文解读11——Mask R-CNN

目的让Faster R-CNN能做实例分割的任务. 方法模型的结构图如下. 与Faster R-CNN相比,主要有两点变化. (1) 用RoI Align替代RoI Pool. 首先回顾一下RoI Pool,流程为:将RPN产生的原图侯选框映射到CNNs输出的feature map上,显然原图比feature map大,所以映射后的像素坐标可能会有小数,这里的做法是用近邻插值法,通俗讲,坐标四舍五入. 而这种做法肯定会带来一些空间位置上的小误差,而我们后面的实例分割是逐像素的,接受不了这种误

目标检测论文（尤其针对一些小目标的可能改进方法）

------------------------------------------------------------------------About Face detection------------------------------------------------------------------------1.Finding Tiny Faces Code:https://github.com/peiyunh/tiny 小目标检测难3大原因:目标本身尺度变化.图像

目标检测论文阅读：Deformable Convolutional Networks

https://blog.csdn.net/qq_21949357/article/details/80538255 这篇论文其实读起来还是比较难懂的,主要是细节部分很需要推敲,尤其是deformable的卷积如何实现的一步上,在写这篇博客之前,我也查阅了很多其他人的分享或者去github找代码,当然也不敢说完全了解了这种特殊的卷积--仅仅做一点自己的阅读心得与体会吧.这是一篇很有意义的工作,但是和深度学习很多论文一样,在读完之后内心也不免有着种种疑云. Deformable Convoluti

4. 基于深度学习的目标检测算法的综述(转)

4. 基于深度学习的目标检测算法的综述(转) 原文链接:https://www.cnblogs.com/zyly/p/9250195.html 目录一相关研究 1.选择性搜索(Selective Search) 2.OverFeat 二.基于区域提名的方法 1.R-CNN 2.SPP-Net 3.Fast R-CNN 4.Faster R-CNN 5.R-FCN 三端对端的方法 1.YOLO 2.SSD 四总结在前面几节中,我们已经介绍了什么是目标检测,以及如何进行目标检测,还提及了滑

An Analysis of Scale Invariance in Object Detection – SNIP 论文解读

前言本来想按照惯例来一个overview的,结果看到一篇十分不错而且详细的介绍,因此copy过来,自己在前面大体总结一下论文,细节不做赘述,引用文章讲得很详细. 论文概述引用文章以下内容来自:http://lowrank.science/SNIP/ 这篇日志记录一些对下面这篇 CVPR 2018 Oral 文章的笔记. Singh B, Davis L S. An Analysis of Scale Invariance in Object Detection–SNIP[C]//Proce

CVPR 2019 论文解读 | 小样本域适应的目标检测

引文 ? 最近笔者也在寻找目标检测的其他方向,一般可以继续挖掘的方向是从目标检测的数据入手,困难样本的目标检测,如检测物体被遮挡,极小人脸检测,亦或者数据样本不足的算法.这里笔者介绍一篇小样本(few-shot)数据方向下的域适应(Domain Adaptation)的目标检测算法,这篇新加坡国立大学&华为诺亚方舟实验室的paper<Few-shot Adaptive Faster R-CNN>被收录于CVPR2019,解决的具体问题场景是我们有在普通常见场景下的汽车目标检测,我们只有

猜你喜欢

win10设置两个显示器不用同一个壁纸

该功能在WIN8中存在,但是微软在WIN10中取消了它(取消了双屏单独设置墻纸) 可以用以下办法完成设置: 1)WIN+R打开运行窗口,复制这一段命令control /name Microsoft.P ...

11-10C#基础--数据库之视图

视图视图实际就是对表的连接展现出来的结果建成的虚拟表.简单来说,视图实际上就是一个虚拟的表,通过表与表之间的关系连接起来,方便查询时使用. 首先,将需要连接的语句存储到数据库中,定义新的视图名代替连 ...

java集合框架03

Collections工具类的使用 public class News implements Comparable { private int id; //新闻编号 private String ti ...

T-SQL 一次插入多行数据

使用 INSERT SELECT 向表中插入数据 --将t1中查询到的数据插入添加到t2中(t2表必须存在,且顺序.数据类型必须与t1一致) INSERT INTO t2(USERNAME,PASSW ...

VMware tools怎么删除rpm -e open-vm-tools-desktop vm12序列号5A02H-AU243-TZJ49-GTC7K-3C61NVF5XA-FNDDJ-085GZ-4 ...

CentOS下安装Apache步骤详解

CentOS下安装Apache步骤详解一.实验环境 Linux: CentOS release 6.7 (Final) Apache: httpd-2.4.23.tar.gz VMware: VMw ...

[Angular 2] ElementRef, @ViewChild & Renderer

ElementRef: In Angular2 Doc, it suggest to "avoid" using ElementRef. It access DOM directl ...

python学习1（小白记录）

python创建cocos2d-x项目注意点1. 2.7.5版本号的.配置好环境变量之后.要切换到tools文件夹下.直接运行 python create_project.py ..........这 ...

github图片

github:https://github.com/BigShow1949/BigShow1949

linux中添加环境变量（python为例）

最近想用Django搭建个人博客,之前学了些python基础语法,准备边学习Django边实战操作.自己有一个阿里云服务器,用的centOS,自带的是python2.7版本,我直接安装了python3 ...

UIImage 类说明

+ (UIImage *)imageNamed:(NSString *)name inBundle:(NSBundle *)bundle compatibleWithTraitCollection:( ...

Java的四种引用源代码例子

Java的四种引用源代码例子不解释,直接上代码,千言万语顶不住一行代码. package com.apkkids.javalanguage; import java.lang.ref.Phantom ...

深入struts2 （一）---Xwork介绍

1 基本知识由于struts2是在webwrok的技术基础上开发的,采用拦截器的机制来处理用户请求的全新MVC框架.而webwork是建立在成为xwork的command模式框架之上的强大 ...

LeerCode 123 Best Time to Buy and Sell Stock III之O(n)解法

Say you have an array for which the ith element is the price of a given stock on day i. Design an al ...

【caption,thead,tfoot,tbody的使用以及使用nowrap禁止换行】

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/ ...

oracle 的各种连接

SQL UNION 操作符UNION 操作符用于合并两个或多个 SELECT 语句的结果集. 请注意,UNION 内部的 SELECT 语句必须拥有相同数量的列.列也必须拥有相似的数据类型.同时,每条 ...

jQuery 选择器和dom操作

JQuery选择器 1.基本选择器基本选择器是JQuery中最常用的选择器,也是最简单的选择器,它通过元素id.class 和标签名来查找DOM元素.这个非常重要,下面的内容都是以此为基础,逐级提高 ...

今天在写powershell脚本中犯的两个错误

可能是因为牙痛没睡好,今天老是犯错,还是脚本写错,特别难调. 第一个错误: powershell脚本里面,函数与函数互相调用的传参.其实就像调用普通的cmdlet一样的写法,应该这么写: Add-Sc ...

java中简单字符替换

在网络编程中,假设URL含有特殊字符,如空格.'#'等,server将无法识别导致无法获得正确的參数值.我们须要将这些特殊字符转换成server能够识别的字符,比如将空格转换成'%20'.给定一个字符 ...

FineReport报表系统实例方案之医院院长查询分析系统

医院院长查询系统目前,大中型医院的信息处理正从传统手工方式飞速向电脑信息化建设方案转变,一个大中型医院担负着繁重的医疗和科研任务,以及繁杂的事务性工作,院长必须时刻与各科室保持密切的连续,以便随时了 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.