参考:https://blog.csdn.net/lanran2/article/details/60143861
ROI pooling:
ROI是Regin of Interest的简写,指的是特征图上的框,特点在于输入特征图尺寸不固定,但是输出特征图尺寸固定。
这里加一个Fast RCNN和Faster RCNN在ROI步骤前的区别:
1)在Fast RCNN中,RoI是指Selective Search产生的候选框在特征图的映射
2)在Faster RCNN中,RoI是由RPN产生的候选框在特征图的映射
如上为Fast RCNN的整体结构,经过提取候选框后完成在feature map上的映射,再经RoI pooling来将多个不同尺寸的RoI统一到相同的尺寸,然后再提取特征。
RoI pooling的输出:
输出的是batch个vector,其中batch的值是在上面的例子中是单个给定像素图中RoI的个数,vector的大小为channel*w*h(这里的channel也就是上面红色小矩阵的厚度),也就是说RoI Pooling的过程就是将大小不同的box矩形框,映射成固定大小(w*h)的矩形框。
原文地址:https://www.cnblogs.com/xiaochouk/p/9079461.html
时间: 2024-11-08 22:24:23