Bag of Visual Word

Motivation

1)纹理识别(texture recognition)

texton: refer to fundamental micro-structures in generic material images and the basic elements in early visual perception.

纹理是由图像中一些基本的细小结构组成的,是早期视觉感知中的基本单元。局部的细小结构组合在一起,形成了图像中的纹理,这与BoV的思想有相同的地方。

2)文档检索(Document Retrieval)

文档检索基于关键字查询的方法中,Bag of Words方法非常流行,其基本思想是:统计语料库(Corpus)中的所有单词组成单词表,对于每一篇文档统计其中的单词出现的频次,用由这些单词频率组成的直方图来表示这篇文档。

Outline

Bag of visual word类似于BoW模型,基本思想概括如下:

1)提取特征(Extract Features)

根据具体应用考虑,综合考虑特征的独特性、提取复杂性、效果好坏,处理是否方便等选择特征。

2)学习视觉词袋(Learn Visual Vocabulary)

统计图像数据库中出现的所有特征,去除冗余组成词袋。如果提取的图像特征过多,一般需要利用聚类算法先把相近的单词归为一类(类似于文档检索里的找词根),利用这些聚类结果来组成词袋。

3)利用视觉词袋量化图像特征(Quantize features using visual vocabulary)

4)利用词频表示图像(Represent images by frequencies of visual words)

时间: 2024-08-25 23:17:28

Bag of Visual Word的相关文章

模式识别之检索---Bag of visual word(词袋模型)

visual words 视觉单词 http://blog.csdn.net/v_july_v/article/details/8203674 http://blog.csdn.net/pi9nc/article/category/1262464 http://vdisk.weibo.com/s/bUbzJ http://blog.csdn.net/pi9nc/article/details/27713009 http://blog.csdn.net/v_JULY_v/article/detai

Image Retrieval Using Customized Bag of Features

This example shows how to create a Content Based Image Retrieval (CBIR) system using a customized bag-of-features workflow. Introduction Content Based Image Retrieval (CBIR) systems are used to find images that are visually similar to a query image.

Bag of Features (BOF)图像检索算法

1.首先,我们用surf算法生成图像库中每幅图的特征点及描述符. 2.再用k-means算法对图像库中的特征点进行训练,生成类心. 3.生成每幅图像的BOF,具体方法为:判断图像的每个特征点与哪个类心最近,最近则放入该类心,最后将生成一列频数表,即初步的无权BOF. 4.通过tf-idf对频数表加上权重,生成最终的bof.(因为每个类心对图像的影响不同.比如超市里条形码中的第一位总是6,它对辨别产品毫无作用,因此权重要减小). 5.对query进来的图像也进行3.4步操作,生成一列query图的

基于randomized visual phrase的目标检索

这个算法是用于目标检索的比较快速的一个算法,参考Randomized Visual Phrases for Object Search. 算法的流程如下: //图片训练阶段 1读入N张图片 2 转换成灰度图 3 检测N张图片的特征点,本算法中应用的是SIFT特征. 4 生成描述子 5 描述子聚类,生成visual word,用kmeans()算法完成. 6 将图片库中的图片用另一种方式进行描述 将每个图片中所有的特征点用[ x,y,v ]表示.其中,x,y是每个特征点的坐标,v代表这个特征点对应

计算Fisher vector和VLAD

This short tutorial shows how to compute Fisher vector and VLAD encodings with VLFeat MATLAB interface. These encoding serve a similar purposes: summarizing in a vectorial statistic a number of local feature descriptors (e.g. SIFT). Similarly to bag

图像处理与计算机视觉基础,经典以及最近发展

*************************************************************************************************************** 在这里,我特别声明:本文章的源作者是   杨晓冬  (个人邮箱:[email protected]).原文的链接是 http://www.iask.sina.com.cn/u/2252291285/ish.版权归 杨晓冬 朋友所有. 我非常感谢原作者辛勤地编写本文章,并愿意共

语义分析的一些方法

语义分析的一些方法 作者:火光摇曳 语义分析的一些方法(上篇) 语义分析的一些方法(中篇) 语义分析的一些方法(下篇) 语义分析,本文指运用各种机器学习方法,挖掘与学习文本.图片等的深层次概念.wikipedia上的解释:In machine learning, semantic analysis of a corpus is the task of building structures that approximate concepts from a large set of documen

Fisher vector fundamentals

文章<Fisher Kernels on Visual Vocabularies for Image Categorization>中提到: Pattern classication techniques can be divided into the classes ofgenerative approaches anddiscriminative approaches. While the first class focuses onthe modeling of class-condit

Aggregating local features for Image Retrieval

Josef和Andrew在2003年的ICCV上发表的论文[10]中,将文档检索的方法借鉴到了视频中的对象检测中.他们首先将图像的特征描述类比成单词,并建立了基于SIFT特征的vusual word dictionary,结合停止词.TF-IDF和余弦相似度等思想检索包含相同对象的图像帧,最后基于局部特征的匹配和空间一致性完成了对象的匹配.文档检索与计算机视觉之间渊源颇深,在CV领域常常会遇到要将图像的多个局部特征描述融合为一条特征向量的问题,比如常用的BoVW.VLAD和Fisher Vect