目标检测——深度学习下的小目标检测(检测难的原因和Tricks)

小目标难检测原因

主要原因

(1)小目标在原图中尺寸比较小,通用目标检测模型中,一般的基础骨干神经网络(VGG系列和Resnet系列)都有几次下采样处理,导致小目标在特征图的尺寸基本上只有个位数的像素大小,导致设计的目标检测分类器对小目标的分类效果差。

(2)小目标在原图中尺寸比较小,通用目标检测模型中,一般的基础骨干神经网络(VGG系列和Resnet系列)都有几次下采样处理,如果分类和回归操作在经过几层下采样处理的 特征层进行,小目标特征的感受野映射回原图将可能大于小目标在原图的尺寸,造成检测效果差。

其他原因

(1)小目标在原图中的数量较少,检测器提取的特征较少,导致小目标的检测效果差。

(2)神经网络在学习中被大目标主导,小目标在整个学习过程被忽视,导致导致小目标的检测效果差。

Tricks

(1) data-augmentation.简单粗暴,比如将图像放大,利用 image pyramid多尺度检测,最后将检测结果融合.缺点是操作复杂,计算量大,实际情况中不实用;

(2) 特征融合方法:FPN这些,多尺度feature map预测,feature stride可以从更小的开始;

(3)合适的训练方法:CVPR2018的SNIP以及SNIPER;

(4)设置更小更稠密的anchor,设计anchor match strategy等,参考S3FD;

(5)利用GAN将小物体放大再检测,CVPR2018有这样的论文;

(6)利用context信息,简历object和context的联系,比如relation network;

(7)有密集遮挡,如何把location 和Classification 做的更好,参考IoU loss, repulsion loss等.

(8)卷积神经网络设计时尽量度采用步长为1,尽可能保留多的目标特征。

原文地址:https://www.cnblogs.com/E-Dreamer-Blogs/p/11442927.html

时间: 2024-07-31 15:46:42

目标检测——深度学习下的小目标检测(检测难的原因和Tricks)的相关文章

立下一个小目标实现自我人生价值

今天是写作训练的第三天,虽然说是写作训练,但是开始写作之前,给尹老师上了几天关于立目标的内容,这不今天总结了一下关于立目标的内容,里面总结了不少有意思的观点,特此分享给哪些无法坚持做事情的朋友. 今日主题 1.总结回归这几天上的内容 2.关于什么是学习的探讨 目标回顾 1.梳理现状.现有资源.想做的事情.时间安排等 2.确立目标.目标具体化 3.将大目标拆分小目标 4.提前梳理可能会遇到的问题 5.持续激励自己,运用心想事成大法 经过几天的课程,我们的尹老师对目标明确了不少,这不,都能写这么多内

随时更新———个人喜欢的关于模式识别、机器学习、推荐系统、图像特征、深度学习、数值计算、目标跟踪等方面个人主页及博客

目标检測.识别.分类.特征点的提取 David Lowe:Sift算法的发明者,天才. Rob Hess:sift的源代码OpenSift的作者,个人主页上有openSift的下载链接.Opencv中sift的实现.也是參考这个. Koen van de Sande:作者给出了sift,densesift,colorsift等等经常使用的特征点程序.输出格式见个人主页说明,当然这个特征点的算法,在Opencv中都有实现. Ivan Laptev:作者给出了物体检測等方面丰富C\C++源代码,及部

行人检测 深度学习篇

樊恒徐俊等基于深度学习的人体行为识别J武汉大学学报2016414492-497 引言 行为识别整体流程 前景提取 行为识别过程 实验分析 芮挺等 基于深度卷积神经网络的行人检测 计算机工程与应用 2015 引言 卷积神经网络结构与特点 行人检测卷积神经网络结构 实验对比总结 张 阳 基于深信度网络分类算法的行人检测方法J 计算机应用研究 20163302 总体来说大部分浏览下就行. 樊恒,徐俊等.基于深度学习的人体行为识别[J].武汉大学学报,2016,41(4):492-497. 0 引言 目

深度学习下的验证码识别教程

转:https://bbs.125.la/thread-14031313-1-1.html 随着大数据时代,人工智能时代的到来,深度学习的应用越来越广,场景识别.目标检测.人脸识别.图像识别等等广泛应用.在人工智能方面.深度学习框架主要运用于python,c++等资源.而易语言使用深度学习框架的资料,源码缺十分稀少.于是我决定给大家录制一套易语言深度学习的教程. 本套教程基于我自己开发的CC框架,下面这些图片案例,就是深度学习做的效果,非常棒: <ignore_js_op> 人脸识别.场景分割

缺陷检测 深度学习

mark 一个网站:https://www.vidi-systems.com/ 检测效果不错,而且是实际图片,能够调节阈值,貌似用的是卷积神经网络

从手淘搜索到优酷短视频,阿里巴巴是如何在搜索推荐领域下应用深度学习的?

摘要:深度学习是一个既可以处理特征.学习特征又可以实现最后的排序打分的一套整体解决方案,借助深度学习的解决方案,搜索推荐的工作方式将发生巨大的变化.想知道阿里巴巴如何将在搜索推荐领域下应用深度学习技术的吗?想知道手淘和优酷搜索结果的个性化又是如何实现的吗?本文不容错过! 本节视频地址:http://click.aliyun.com/m/48161/ PDF下载:http://click.aliyun.com/m/49207/ 演讲嘉宾简介: 孙修宇(花名:翎翀),阿里巴巴机器智能技术实验室算法专

先定个小目标, 使用C# 开发的千万级应用

dotNET跨平台 微信号 opendotnet 功能介绍 在这里你可以谈微软.NET,Mono的跨平台开发技术,也可以谈谈其他的跨平台技术.在这里可以让你的.NET项目有新的思路,不局限于微软的技术栈,横跨Windows,Linux 主流平台 话说昨天的港股发生了一件大事,腾讯成为亚洲市值最高的公司,在这历史性的一刻,作为在鹅厂工作的C# 程序员,也应该让世人了解下C# 并不是那么没有市场.在鹅厂,代码构成中60%以上是C++, C#也有10%左右的份额,后续的文章中我会和你继续分享,当然如果

深度学习在图像识别中的研究进展与展望

深度学习在图像识别中的研究进展与展望 深度学习是近十年来人工智能领域取得的最重要的突破之一.它在语音识别.自然语言处理.计算机视觉.图像与视频分析.多媒体等诸多领域都取得了巨大成功.本文将重点介绍深度学习在物体识别.物体检测.视频分析的最新研究进展,并探讨其发展趋势. 1.深度学习发展历史的回顾 现在的深度学习模型属于神经网络.神经网络的历史可以追溯到上世纪四十年代,曾经在八九十年代流行.神经网络试图通过大脑认知的机理,解决各种机器学习的问题.1986年Rumelhart.Hinton和Will

深度学习之对抗样本问题

深度学习之对抗样本问题 2006 年,Geoffrey Hinton 提出了深度学习.受益于大数据的出现和大规模计算能力的提升,深度学习已然成为最活跃的计算机研究领域之一.深度学习的多层非线性结构使其具备强大的特征表达能力和对复杂任务的建模能力.最近几年,深度学习的发展也带动了一系列的研究.尤其是在图像识别领域,在一些标准测试集上的试验表明,深度模型的识别能力已经可以达到人类的水平.但是,人们还是会产生一个疑问,对于一个非正常的输入,深度模型是否依然能够产生满意的结果.的确,最近有研究者开始关注