《How hard can it be? Estimating the difficulty of visual search in an image》和 PPT

《How hard can it be? Estimating the difficulty of visual search in an image》发表于2016年CVPR上,这篇文章是老师推荐的,需要说明的是它的model相对来说简单,而其真正的想法才是比较新颖的。

作者做的主要工作是提出了一种在视觉搜索中衡量图像的搜索难度的方法。我们知道人的视觉在进行搜索时,首先对搜索图像进行观察,获取图像中的有特征的重要主体,再搜寻与其相似的图像,即先对图像进行抽象,再进行搜索。在当前的研究中,大多数人都在研究如何提高搜索精度,但是作者却在思考,什么样的图片是容易被检索的,什么样的是难被检索的。打个比喻,有一根绳子,有人说1米,有人说2米,到底是多少呢,我们得拿一把尺子来测量一下,作者提出的方法就相当于“尺子”,解决一种度量问题,类似于秦始皇统一度量衡,以后大家都要拿这个来衡量,所以这是一种开创性的工作。

作为一种开创性的工作,数据一般需要自己获取,所以第一部分作者也是花了大量的精力标记数据,提出用人的反应时间作为标记;随后作者证明了图像的搜索难度与人的反应时间是成正比的,即用时间标记是合理的;然后作者从人的认知角度分析了影响图像搜索难易的七大因素,并分别分析各自的影响程度;之后作者提出自己的模型CNN + v-SVR和图像难度分数的计算方法:对该图片的所有标记时间的几何中值(时间连乘的平方根)作为难度分数;与baselines比较,获得比较好的效果;最后作者提出了本模型在弱监督目标定位和半监督目标分类领域能也能起到作用,并给出实验证明。详细说明请参看另一篇博客:http://blog.csdn.net/helloeveryon/article/details/51893251

模型很简单,但是这种思路值得学习。由于博客上不能上传PPT,所以我就直接贴图了。需要PPT的同学们可以留言。

时间: 2024-10-10 07:41:10

《How hard can it be? Estimating the difficulty of visual search in an image》和 PPT的相关文章

C++alpha beta剪枝算法 实现4*4 tic-tac-toe

先上一张alpha beta原理图,一看就懂 代码有点长,主要是因为算评估值得时候用的是穷举. 玩家是1,电脑是2,可以选择难度以及先手. // // main.cpp // Tic-Tac-Toe // // Created by mac on 2017/4/2. // Copyright ? 2017年 mac. All rights reserved. // #include <iostream> #include <vector> #include <math.h&g

KDD2015,Accepted Papers

Accepted Papers by Session Research Session RT01: Social and Graphs 1Tuesday 10:20 am–12:00 pm | Level 3 – Ballroom AChair: Tanya Berger-Wolf Efficient Algorithms for Public-Private Social NetworksFlavio Chierichetti,Sapienza University of Rome; Ales

Neural Networks and Deep Learning_#3

CHAPTER 1 Using neural nets to recognize handwritten digits The human visual system is one of the wonders of the world. Consider the following sequence of handwritten digits: Most people effortlessly recognize those digits as 504192. That ease is dec

{ICIP2014}{收录论文列表}

This article come from HEREARS-L1: Learning Tuesday 10:30–12:30; Oral Session; Room: Leonard de Vinci 10:30  ARS-L1.1—GROUP STRUCTURED DIRTY DICTIONARY LEARNING FOR CLASSIFICATION Yuanming Suo, Minh Dao, Trac Tran, Johns Hopkins University, USA; Hojj

poj 2151 Check the difficulty of problems

dp[i][j][s]表示第i个人,在前j个问题解决了s个问题 dp[i][j][s]=dp[i][j-1][s-1]*p[i][j]+dp[i][j-1][s]*(1-p[i][j]); 1 #include<iostream> 2 #include<string> 3 #include<cstdio> 4 #include<vector> 5 #include<queue> 6 #include<stack> 7 #include

POJ 2151 Check the difficulty of problems (概率dp)

题意:给出m.t.n,接着给出t行m列,表示第i个队伍解决第j题的概率. 现在让你求:每个队伍都至少解出1题,且解出题目最多的队伍至少要解出n道题的概率是多少? 思路:求补集. 即所有队伍都解出题目的概率,减去所有队伍解出的题数在1~n-1之间的概率 这里关键是如何求出某个队伍解出的题数在1~n-1之间的概率,采用dp的方法: 用p(i,j)表示前i道题能解出j道的概率,有p(i,j)=p(i-1,j)*(1-p(i))+p(i-1,j-1)*p(i)p(i)表示解出第i题的概率. #inclu

poj 2151 Check the difficulty of problems(线段树+概率)

Check the difficulty of problems Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 4465   Accepted: 1966 Description Organizing a programming contest is not an easy job. To avoid making the problems too difficult, the organizer usually exp

POJ 2151 Check the difficulty of problems(概率dp)

Language: Default Check the difficulty of problems Time Limit: 2000MS   Memory Limit: 65536K Total Submissions: 5419   Accepted: 2384 Description Organizing a programming contest is not an easy job. To avoid making the problems too difficult, the org

Leet Code OJ 119. Pascal&#39;s Triangle II [Difficulty: Easy]

题目: Given an index k, return the kth row of the Pascal's triangle. For example, given k = 3, Return [1,3,3,1]. Note: Could you optimize your algorithm to use only O(k) extra space? 翻译: 给定一个下标k,返回第k行的杨辉三角. 例如给定k=3,返回[1,3,3,1]. 提示:你可以优化你的算法,让它只使用O(k)的额