奇点云三角肌「秀肌肉」,端化目标检测模型再获突破

人工智能正在驱动新一轮的商业变革,而算法技术则是推动核心底层技术的重要力量。算法崛起时代,技术浪潮可谓一日千里,算法工程师也只有不断精进自身技术,才能与时俱进、驭浪前行。近日,奇点云算法工程师三角肌在目标检测算法领域又有新突破。

摘要

卷积神经网络对目标检测的精度有着显著的提升,并且随着卷积神经网络的深度加深,对目标检测精度提升也越大,但是也需要更多的浮点计算。许多研究者通过知识蒸馏的方法,通过把一个更深更大的教师网络中的知识转移到一个小的学生网络中,以提高学生网络在目标检测中的效果。而大部分知识蒸馏的方法都需要设计复杂的代价函数,并且多数针对两步目标检测算法,本文针对一步目标检测算法提出一个干净有效的知识蒸馏方案。将教师网络生成的特征层作为真实样本,学生网络生成的特征层做为假样本,并对两者做生成对抗训练,以提高学生网络在一步目标检测中的表现。

1 Introduction

近些年来,随着目标检测算法的发展,研究者们发现利用更深更大的卷积神经网络作为骨架,对目标检测算法的精度提升越大。并且随着目标检测算法的检测精度提升,使视觉检测算法逐渐从非关键性领域,走向关键性领域(比如无人驾驶和医疗等领域)。但是为了保证检测精度,不得不使用更大的卷积神经网络作为骨架,造成检测速度下降,计算设备成本增加。因此许多研究者在确保检测精度的前提下,提高检测速度提出了很多方法和总结,如通过深度分离卷积 [1,2],或者通过点群卷积(pointwise group convolution)和通道混洗(channel shuffle)[3, 4] 来降低卷积神经网络浮点运算次数的方法,在保证骨架网络精度和容量的情况下减少计算量。虽然获得可观的提速效果,但是这些方法需要精心设计和调整骨架网络。很多研究者认为更深的骨架网络虽然有着更大的网络容量,因此在图像分类、目标检测等任务上有着更优秀的表现。但是一些特定的任务并不需要这么大的容量,所以在保证卷积神经网络精度的情况和下,对卷积神经网络做压缩、量化、通道减枝等[5, 6, 7, 8, 9]。

另一方面,有关于知识蒸馏的工作表明[10, 11, 12, 13],使用一个更深更大的模型,并且在充分训练完毕后作为teacher net,然后再选取一个比较浅的模型作为student net,最后使用teacher net输出的结果或者中间结果作为soft label结合真实样本的true label同时训练student net,可以极大的提升student net在特定任务上的表现。但是大部分这些方法都需要设计非常复杂的代价函数和训练方式,并且这些方法多用于图像分类和两步目标检测等,极少用于一步目标检测。因此,我们需要一个更加简单而有效,并且可以适用于一步目标检测的知识蒸馏方式。本文提出一种简单而有效知识蒸馏神经网络架构,并且可以明显的提升student net在一步目标检测网络的表现。和常规的知识蒸馏方式不同的是,我们参考对抗生成的神经网络架构[14],将重型目标检测神经网络和轻型目标检测神经网络的骨架分别拆分出来作为teacher net和student net,然后把teacher net 生成的feature map作为真实样本,而student net则作为生成器,并把student net生成的feature map作为假样本,最后根据真实样本和假样本设计一个神经网络作为判别器,做生成对抗训练。

我们的贡献主要有两点:

1 提出一种不需要设计复杂的代价函数的网络架构,并且可以适用于一步目标检测。

2 利用对抗生成网络架构,避免复杂的知识迁移设计,让student net自动的从teacher net中获取暗知识。

2 Related Works

深度学习目标检测算法架构主要分为两种,一种是一步检测,比如Liu W等人提出的SSD[15],直接通过通过卷积神经网络回归出物体的位置和类别,另一种是二步检测,如girshick等人提出的fast rcnn[16],以及后来Faster-RCNN [17] and R-FCN [18]等,首先通过卷积神经网络回归候选框,最后根据候选框再次识别每个候选框的类别,并回归出正确的位置。

网络裁剪,许多研究者认为深度神经网络被过度参数化,并且有很多冗余的神经元和连接,He Y等人认为[8],cnn每层神经元都是稀疏的,利用lasso regression回归找出cnn每层最有代表性的神经元重构该层的输出。Zhuang Z等人[9]认为layer-by-layer进行通道剪枝会影响cnn的鉴别能力,所以通过在fine-tune和剪枝阶段加入辅助loss,来保留cnn每层的鉴别能力。

网络量化, Wu J等人[20]通过k-means聚类算法加速和压缩模型的卷积层和全连接层,通过减小每层输出响应的估计误差可实现更好的量化结果,并提出一种有效的训练方案抑制量化后的多层累积误差 。Jacob B[21]等人提出将weights和inputs量化为uint8 bias量化为unit32同时训练期间前向时候采用量化,反向修正误差不量化,以确保cnn表现的情况下提高inference速度。

知识蒸馏是一种压缩模型并确保准确的一种方法。hinton 等人提出[2]将teacher net输出的结果作为soft label,并提倡使用温度交叉熵而不是L2损失。romero 等人[19]认为需要更多的unlabeled data让student net去mimic才能使student net经可能的接近teacher net,Chen G[12]等人在优化2步目标检测网络分别将teacher net的中间feature map 以及rpn/rcnn的暗知识提取出来让student net去mimic。其他研究者也有将teacher net的attention信息给student网络,如Zagoruyko S[22]等人提出spatial-attention,将teacher net的热力信息传递给student net。Yim J等人[23]将teacher net层与层之间的关系作为student网络mimic的目标。但是他们设计的的知识蒸馏都是要设计非常复杂的loss function,和复杂的暗知识的提取方式,并且这些方法多是在两步目标检测算法中很少用于一步目标检测中。为了能用一个简单有效的知识蒸馏的方式,我们参考生成对抗网络的架构方式[14]将教师网络生成的特征层作为真实样本,学生网络生成的特征层做为假样本,并对两者做生成对抗训练,以提高学生网络在一步目标检测中的表现。

3 Method

在本文中,我们采用一步目标检测算法SSD[15]作为我们的目标检测算法,SSD目标检测算法结构主要分成两部分,1)骨架网络,作为特征提取器。2)Head,在骨架网络提取的特征上,检测出目标的类别和位置。为了能获取更好的知识蒸馏效果,合理利用这个两个部分至关重要。

3.1 Overall Structure

fig 1为我们算法模型的整体结构,我们首先使用一个容量更大的SSD模型,在充分训练后将该SSD模型拆分成骨架网络和SSD-Head,其中骨架网络作为teacher net,然后再挑选一个容量较小的CNN作为student net。我们把teacher net生成的多个feature map作为true sample,而student net生成的多个feature map作为fake sample,并且将true sample和fake sample送入D Net中相对应的每个判别网络(fig 2)中,同时把fake sample输入到SSD-Head中。


3.2 Training Process

(1)


公式1中的N代表batchsize的大小,D代表判别网络,Teacher和Student分别代表teacher net和student net, θt、θs、θd分别代表teacher net、student net 和D Net模块中每个判别网络的weights。Lconf表示SSD中分类的损失函数,Lloc表示SSD中边界框的损失函数。

4 Experiment

在本章节,我们将在PASCAL VOC中做实验来验证我们的方法,包含20个类别。并且我们的方法训练的硬件为two NVIDIA GTX 1080Ti GPUs。训练所用的软件框架为gluoncv。

4.1 Training and testing data

由于时间的关系,我们训练使用的数据集Pascal Voc 2012trainval和Pascal Voc 2007 trainval sets,测试数据集为Pascal Voc 2007 test sets。该数据集包含检测物体的类别和位置信息。评估标准按照Pascal Voc竞赛所约定的,通过iou=0.5时的mAP来评估模型检测精度。而coco数据集上,使用coco 2017 trainset作为训练集,coco 2017 test作为测试集。

4.2 Results

我们将原生的SSD和在不同的Teacher net下知识蒸馏的SSD做比较,最高可以提升student net 2.8mAP。不过有趣的是,当teacher net为ResNet101,student net为ResNet18时,提升的效果反而不如ResNet50。而在coco上使用resnet50作为teacher net,moblinet作为student net,提升Moblient-SSD 4个mAP。

Table 1. Different student nets are not used GAN-knowledge distillation and the use of a GAN-knowledge distillation in different teacher net test results.

目前已经将该方法使用在faster rcnn上,考虑到时间,目前仅仅在pascal voc 2007上进行测试,coco正在训练。

Table 2. moblienetv1 use GAN-knowledge distillation in coco.


Table 3. Teacher net为骨架网络为ResNet101的faster rcnn,且使用Pascal Voc 2007 trainval作为训练集,在Pascal Voc 2007 test测试集上mAP为74.8+。第一行和第二行使用GAN Knowledge Distillation[1]方法,第三行为cvpr2019的 Distilling Object Detectors with Fine-grained Feature Imitation[2]的方法效果。

原文地址:https://blog.51cto.com/14386859/2417817

时间: 2024-08-10 21:43:26

奇点云三角肌「秀肌肉」,端化目标检测模型再获突破的相关文章

「AHOI2018 初中组」根式化简(分解质因数+推性质)

https://loj.ac/problem/2993 之前在哪里见过这个套路,但忘记了是在哪里了,在这里总结一下 暴力就是筛出\(n^{\frac{1}{3}}\)里的所有质数,然后用它们去分解. 这个有\(80p\). 事实上,我们可以只用\(n^{\frac{1}{4}}\)内的质数去分解,对于分解剩下的那个数\(x\). \(x\)的最小质因子\(>n^{\frac{1}{4}}\),所以它最多有\(4-1=3\)个质因子. 所以它要是想有一个\(3\)次以上的质因子,就只能是\(x^{

华为互认证|大道云行亚博官网国产化生态融入再获突破

近日,华为TaiShan服务器与大道云行分布式文件存储系统XDFS亚博官网(yb1s.in)完成兼容性认证测试,并发布联合解决方案.此次验证围绕数据中心软硬件环境.性能测试等多方面开展.从承载业务性能测试和并发压力测试等多项结果来看,基于鲲鹏处理器的XDFS在测试中运行稳定.性能优异.本次认证及解决方案发布加深了彼此对产品的了解和认可,为后续进一步的合作打下了良好的基础. TaiShan服务器是基于华为鲲鹏处理器的新一代国产化数据中心服务器,能为大数据.分布式存储.高性能计算.数据库等应用高效加

WAIC | 奇点云携「酷炫AI应用」亮相2019世界人工智能大会

你是否还在疑惑“人工智能可否改变世界?” 那么,你该有一些危机感了. 机器视觉.自然语言处理.智能语音.机器人问诊.智慧驾驶……这些AI技术及应用早已渗入了我们日常生活的点滴. 29日,以「智联世界,无限可能」为主题的2019世界人工智能大会(WAIC)在上海开幕.围绕智能领域的技术前沿.产业趋势和热点问题发表演讲和进行高端对话,打造世界顶尖的智能合作交流平台.作为全球顶级人工智能峰会,WAIC已经成为最活跃的AI产业合作平台,华为.BAT.亚马逊.特斯拉等众多行业领军企业将亮相峰会现场. 汇聚

奇点云COO刘莹应邀出席《APEC SME大数据与人工智能论坛》

10月24日-25日,由亚太经合组织(APEC).韩国中小型及初创企业管理局(the Ministry of SMEs & Startups of Korea)主办的「APEC SME 大数据与人工智能论坛」在韩国首尔举行.? 论坛以「大数据与人工智能如何驱动商业创新」为主题.来自韩国.中国.澳大利亚.俄罗斯.马来西亚等多个经济体的企业家.行业专家学者.政府领导及杰出代表齐聚一堂,分享企业的创新实践,共同展望数智化未来. 奇点云COO刘莹(花名:公主)作为嘉宾应邀出席,发表主题演讲,与参会代表们

未来科技城 x 奇点云打造「企业数据大脑」,助力1.3万家企业服务

“当前,政府数字化和数字政府建设已成为一种趋势.一种必然,并且有了一条水到渠成式的实现路径.” 上升为国家战略的数字中国建设加速了”智慧政务“的生动实践,杭州未来科技城的「企业数据大脑」就是一个典型. 从17年8月开始,入驻的企业迅速增多,这是科技城政府特别直观的感受.伴随而来的,是业务处理日趋复杂.政务信息资源的急剧增长,而已有数据管理模式已不适应大数据时代政务的特点.为贯彻落实“最多跑一次”改革,推进“三化融合”,推行“互联网+”政务服务模式,更精准地服务企业,杭州未来科技城政府联合奇点云,

「产品经理」和「功能经理」的差别

作者:BMAN 产品经理最主要的职责就是懂需求. 看上去好像非常easy.实际上,非常多产品经理都做不到这一点. 举一个样例,就拿红包这个简单的功能来讲,产品经理怎样满足用户需求呢? 好的产品经理会用最简单的功能去满足用户的需求,把核心功能打磨地异常瑞丽. 而有一类糟糕的产品经理,我称之为 "功能经理",他们不断给产品添加新功能.duang duang duang 给产品加一堆特技,觉得这样就行满足用户需求了: watermark/2/text/aHR0cDovL2Jsb2cuY3Nk

硬核!奇点云一举斩获人工智能编程大赛一等奖、三等奖

10月30日,2019上海智慧城市建设「智慧工匠」选树暨软件开发与测试竞赛落幕,奇点云与来自云平台计算.人工智能编程等方向的学者同台竞技,共推人工智能及计算机视觉技术的交流与落地. ? 值得一提的是,奇点云算法工程师涉川.草窗以出色的专业成绩分别斩获本次人工智能赛事的一等奖.三等奖. (涉川.草窗现场领奖) 与往届相比,今年的赛事进一步聚焦云平台计算.人工智能等方向,以科技竞赛.创新方案等方式遴选出精英工程师,弘扬工匠精神. 开发者测试与人工智能编程竞赛是参赛者展示自身学术专业能力与创新技术沉淀

Chrome 扩展 Stylish :给不喜欢某个网站一键「换肤」

原文地址:http://whosmall.com/?post=419 本文标签: Chrome扩展 Chrome浏览器 Chrome插件 Chrome扩展Stylish Stylish是什么 Stylish 是什么? 开门见山,Stylish 的作用是,它可以把百度首页变成这样: 它还能把知乎「拍扁」,让微博网页版变得简洁无比,让 Feedly 用上Material Design-- 这个神奇的 Stylish实际上是一个浏览器插件,适用于 Chrome,Firefox,Opera 以及 Saf

深度 | 邢波教授谈人工智能科学路径:为人工智能装上「无穷动」引擎

深度 | 邢波教授谈人工智能科学路径:为人工智能装上「无穷动」引擎 本文由邢波教授 授权转载 微信公众号:猫匣子 作者:邢波 有些人是因为对人工智能的原理不理解而导致,有些人是为了个人名望而宣扬人工智能威胁论,有些人则是为了商业的利益推动人工智能威胁论.——Yann LeCun   人工智能算法本身这个计算任务像登山,它是有明确的目标的,可以用数学描述和比较的目标,它本身有弹性.容错性.随机性.和客观的量化的可评估性 … 人工智能功能的提升和突破来源于理论模型,算法,和计算引擎的不断创新,缺一不