SPP-Net是出自2015年发表在IEEE上的论文-<Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition>. 池化空间金字塔的核心是: 1.因为,cnn要求图像固定大小,所以要做crop和warp.是因为会影响FC层的权重训练. 当网络输入的是一张任意大小的图片,这个时候我们可以一直进行卷积.池化,直到网络的倒数几层的时候,也就是我们即将与全连接层连接的时候就需要用到(最大)池化空间金字塔,
Girshick, Ross. "Fast r-cnn." Proceedings of the IEEE International Conference on Computer Vision. 2015. 继2014年的RCNN之后,Ross Girshick在15年推出Fast RCNN,构思精巧,流程更为紧凑,大幅提升了目标检测的速度.在Github上提供了源码. 同样使用最大规模的网络,Faster RCNN和RCNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒