最近一直在赶AAAI 的deadline,几乎停滞了文章的阅读,今天虽属休息日,拿来之前一直想看的paper,继续写,为接下来的 tracker 打下基础。。。
今天要讲的是做视觉跟踪的,利用孪生网络进行示例的搜索,就是利用海量video学习一个匹配函数(matching function),通过后续视频帧和第一帧视频的匹配,达到跟踪的目的。猛地一看,这么简单的思路,效果能好吗?但是在tracking的benchmark上也达到了 0.8+的精度。
时间: 2024-10-13 12:56:53