深度学习模型相关知识（2）

参考：https://blog.csdn.net/lanran2/article/details/60143861

ROI pooling：

ROI是Regin of Interest的简写，指的是特征图上的框，特点在于输入特征图尺寸不固定，但是输出特征图尺寸固定。

这里加一个Fast RCNN和Faster RCNN在ROI步骤前的区别：

1）在Fast RCNN中，RoI是指Selective Search产生的候选框在特征图的映射

2）在Faster RCNN中，RoI是由RPN产生的候选框在特征图的映射

如上为Fast RCNN的整体结构，经过提取候选框后完成在feature map上的映射，再经RoI pooling来将多个不同尺寸的RoI统一到相同的尺寸，然后再提取特征。

RoI pooling的输出：

输出的是batch个vector，其中batch的值是在上面的例子中是单个给定像素图中RoI的个数，vector的大小为channel*w*h（这里的channel也就是上面红色小矩阵的厚度），也就是说RoI Pooling的过程就是将大小不同的box矩形框，映射成固定大小（w*h）的矩形框。

原文地址：https://www.cnblogs.com/xiaochouk/p/9079461.html

时间： 2024-11-08 22:24:23

深度学习模型相关知识（2）的相关文章

在NLP中深度学习模型何时需要树形结构？

前段时间阅读了Jiwei Li等人[1]在EMNLP2015上发表的论文<When Are Tree Structures Necessary for Deep Learning of Representations?>,该文主要对比了基于树形结构的递归神经网络(Recursive neural network)和基于序列结构的循环神经网络(Recurrent neural network),在4类NLP任务上进行实验,来讨论深度学习模型何时需要树形结构.下面我将通过分享这篇论文以及查看的一些

文本情感分类（二）：深度学习模型

在<文本情感分类(一):传统模型>一文中,笔者简单介绍了进行文本情感分类的传统思路.传统的思路简单易懂,而且稳定性也比较强,然而存在着两个难以克服的局限性:一.精度问题,传统思路差强人意,当然一般的应用已经足够了,但是要进一步提高精度,却缺乏比较好的方法:二.背景知识问题,传统思路需要事先提取好情感词典,而这一步骤,往往需要人工操作才能保证准确率,换句话说,做这个事情的人,不仅仅要是数据挖掘专家,还需要语言学家,这个背景知识依赖性问题会阻碍着自然语言处理的进步. 庆幸的是,深度学习解决了这个问

提升深度学习模型的表现，你需要这20个技巧

提升深度学习模型的表现,你需要这20个技巧标签: 深度学习 2016-09-24 21:28 6650人阅读评论(0) 收藏举报分类: 深度学习(4) 选自machielearningmastery 机器之心编译作者:Jason Brownlee 参与:杜夏德.陈晨.吴攀.Terrence.李亚洲本文原文的作者 Jason Brownlee 是一位职业软件开发者,没有博士学位的他通过「从应用中学习」的方法自学了机器学习,他表示对帮助职业开发者应用机器学习来解决复杂问题很有热情,也

深度学习模型超参数搜索实用指南

要知道,与机器学习模型不同,深度学习模型里面充满了各种超参数.而且,并非所有参数变量都能对模型的学习过程产生同样的贡献. 考虑到这种额外的复杂性,在一个多维空间中找到这些参数变量的最佳配置并不是件容易的事情. 每一位科学家和研究人员,都希望在现有的资源条件下(计算.金钱和时间),找到最佳的模型. 通常情况下,研究人员和业余爱好者会在开发的最后阶段尝试一种搜索策略.这可能会有助改进他们辛辛苦训练出来的模型. 此外,在半自动/全自动深度学习过程中,超参数搜索也是的一个非常重要的阶段. 超参数到底是什

构建和优化深度学习模型（神经网络机器识图）

DSL(Deep Learning Service)是基于华为云强大高性能计算提供一站式深度学习平台服务,内置大量优化的网络模型算法,以兼容.便携.高效的品质帮助用户轻松使用深度学习技术,通过灵活调度按需服务化方式提供模型训练.评估与预测. 深度学习训练模型:数据准备-->数据模型训练(优化参数)-->反馈损失值-->更多训练评估模型:返回结果为预测值与测试数据集标注值的错误率或准确率深度学习模型的优化方法? 训练次数的调整? 代价函数的调整? 学习率的调整? 训练算法的优化? 神经

深度 | 提升深度学习模型的表现，你需要这20个技巧（附论文）

深度 | 提升深度学习模型的表现,你需要这20个技巧(附论文) 2018-04-15 19:53:45 JF_Ma 阅读数 296更多分类专栏: 机器学习深度 | 提升深度学习模型的表现,你需要这20个技巧(附论文) 2016-09-23 机器之心选自machielearningmastery 机器之心编译作者:Jason Brownlee 参与:杜夏德.陈晨.吴攀.Terrence.李亚洲本文原文的作者 Jason Brownlee 是一位职业软件开发者,没有博士学位的他通过「从应用

深度学习模型的构建

构建深度学习模型的基本步骤需要举例的地方以波士顿房价预测为案例波士顿房价预测是一个经典的机器学习任务,类似于程序员世界的"Hello World".和大家对房价的普遍认知相同,波士顿地区的房价是由诸多因素影响的.该数据集统计了13种可能影响房价的因素和该类型房屋的均价,期望构建一个基于13个因素进行房价预测的模型. 一.数据处理 ? 数据处理包含五个部分:数据导入.数据形状变换.数据集划分.数据归一化处理和封装load data函数.数据预处理后,才能被模型调用. 1.数据形状变换

利用 TFLearn 快速搭建经典深度学习模型

利用 TFLearn 快速搭建经典深度学习模型使用 TensorFlow 一个最大的好处是可以用各种运算符(Ops)灵活构建计算图,同时可以支持自定义运算符(见本公众号早期文章<TensorFlow 增加自定义运算符>).由于运算符的粒度较小,在构建深度学习模型时,代码写出来比较冗长,比如实现卷积层:5, 9 这种方式在设计较大模型时会比较麻烦,需要程序员徒手完成各个运算符之间的连接,像一些中间变量的维度变换.运算符参数选项.多个子网络连接处极易发生问题,肉眼检查也很难发现代码中潜伏的 bu

一种基于脑电图情感识别的新型深度学习模型

目录本分享为脑机学习者Rose整理发表于公众号:脑机接口社区(微信号:Brain_Computer).QQ交流群:903290195 机器学习的最新进展使得检测和识别人类情绪的技术也得到了快速的发展.其中一部分机器学习技术中是通过分析脑电图(EEG)信号来工作的,这些信号本质上是对从一个人的头皮上收集的脑电活动的记录. 过去十多年来,大多数基于脑电图的情绪分类方法都采用了传统的机器学习方法,例如支持向量机(SVM)模型,因为这些方法需要的训练样本较少.事实上之所以使用需要训练样本量少的方法是因