首先放R-CNN的原理图
显然R-CNN的整过过程大致上划分为四步:
1.输入图片
2.生成候选窗口
3.对局部窗口进行特征提取(CNN)
4.分类(Classify regions)
而R-CNN的缺陷就在于对每个候选窗口都要进行特征提取,造成了计算时间成本很大。
再放Fast R-CNN的原理图
Fast R-CNN的提高速度的关键就在于将proposal的region映射到CNN的最后一层conv layer的feature map上,意味着一张图片只需要进行一次特征提取。
而既然R-CNN系列已经发展到了Faster,所以我选择直接用Faster R-CNN,而且Faster可以直接做到实时检测目标(速度能达到在视频中实时检测目标)。
且Faster R-CNN的最大改变就是不使用selective search,而是通过所谓的Region ProposalNetwork(RPN)
时间: 2024-10-25 03:10:37