rcnn开创性工作,但是计算时间太长,重复计算太大。
spp_net将重复计算避免了。
hcp是yan shuicheng那边的,是用bing生成regions,然后用normalized cut将这些regions进行聚类,然后将聚类后剩下较小数量的regions进cnn,其实整体思路也是rcnn,只是减少了regions的数量。当然,其工作目的不一样,其当时这么做主要是为了提高多类分类的效果,如果仅仅这么做会降低检测的准确率,但是多类分类效果肯定会提高。但是,今年看到他们的Detection工作效果很好,说是用到了contextual information,我在想难道是先多类分类,分出来这张图片大概有几类目标,然后再进行检测定位吗?如果这样的话,多类信息怎么在检测中体现呢?我还没想明白,他们的slides里也没说。
由于吧caffe的windows版本调通了。现在spp和rcnn都可以windows下调用了。
时间: 2024-10-11 17:48:58