论文笔记之：Visual Tracking with Fully Convolutional Networks

ICCV 2015 CUHK

　　本文利用 FCN 来做跟踪问题，但开篇就提到并非将其看做是一个黑匣子，只是用来提取特征，而是在大量的图像和 ImageNet 分类任务上关于 CNN 的 feature 做了大量的深度的研究。这些发现促使他们设计了该跟踪系统，他们发现：不同的卷积层会从不同的角度来刻画目标。顶层的 layer 编码了更多的关于语义特征并且可以作为种类检测器，而底层的层懈怠了更多的具有判别性的信息，并且可以更好的区分具有相似外观的目标。在跟踪的过程中利用这两种层的不断切换而完成跟踪。作者还发现，对于一个跟踪目标，仅仅一些神经元是与其有关的，于是提出了一种 feature map 选择机制来移除噪声和不相关的 feature maps，可以减少计算量，并且提升了跟踪的效果。在tracking benchmark 上取得了 state-of-the-art 的效果，具体是如何屌的，让我们进一步的看。

　　Introduction：

　　视觉跟踪领域仍然有许多未能很好解决的问题，像：明显的外观改变，姿态的改变，严重的遮挡，以及复杂背景等等。虽然传统方法利用手工设计的方法也研发了许多经典的跟踪算法，但是随着 CNN 的出现，跟踪领域也逐渐被深度学习方面的技术所占领，主要就是因为 CNN 可以得到更好的 feature 表达，这从很大的程度上超越了传统方法，可以看到最近的深度方面的方法基本都将 tracking 的 benchmark 刷到了 90+% 的精度，但是这些方法基本都是在海量数据上先预训练，然后 transfer 到跟踪问题上。因为跟踪问题，只是提供第一帧的 bounding box 使得深度的海量数据训练的方法有些受困。但是，纯粹的利用 CNN 强大的特征表达能力，并不能说跟踪技术发展的有多快，更加只能的算法还有待开发出来。更多的人只是将 CNN 看作是一个黑匣子，这也是本文一直在强调的，那么本文是怎么做的呢？

　　本文分析了各个层的特征对跟踪的影响，更加合理的选择特征来做到减少计算量的同时，提升跟踪性能。本文发现了两个有意思的属性，即：

　　1. 不同的层次 feature 对跟踪问题的影响不同，具体表现在：

　　　　（1）顶层的 CNN 提出的 feature 具有较好的抽象和高层语义特征。这些特征对于区分不同的类别，或者对付形变和遮挡具有更好的鲁棒性。

　　　　（2）底层的特征提供了更多的细节的局部信息，可以更好的区分外观类似的目标。

　　这些方面的具体表现如下图所示：

时间： 2024-10-06 15:05:23

论文笔记之：Visual Tracking with Fully Convolutional Networks

论文笔记之：Visual Tracking with Fully Convolutional Networks的相关文章

论文阅读笔记：Fully Convolutional Networks for Semantic Segmentation

论文笔记《Fully Convolutional Networks for Semantic Segmentation》

RCNN学习笔记(8)：Fully Convolutional Networks for Semantic Segmentation(全卷积网络FCN）

FCN笔记（Fully Convolutional Networks for Semantic Segmentation）

论文阅读（BaiXiang——【CVPR2016】Multi-Oriented Text Detection with Fully Convolutional Networks）

论文学习：Fully Convolutional Networks for Semantic Segmentation

中文版 R-FCN: Object Detection via Region-based Fully Convolutional Networks

论文笔记：Parallel Tracking and Verifying: A Framework for Real-Time and High Accuracy Visual Tracking

Fully Convolutional Networks for semantic Segmentation（深度学习经典论文翻译）