[论文]Sketch-based 3D model retrieval by viewpoint entropy-based adaptive view clustering

标题:通过基于视点熵的可调整视图聚类的草图3D模型检索

作者:Bo Li,Yijuan Lu,Henry Johan

abstract:搜索基于手绘草图的3D模型对于很多应用来说是直观且重要的,例如说基于草图的3D建模和识别。我们提出了通过使用基于视点熵的可调整视图聚类和形状内容匹配的进行基于草图的3D模型检索。不同的模型由不同的视觉复杂度,因此没有必要来对每一个模型固定相同数目的表示视图。由于这个原因,我们提出了使用采样视同集合的分布和基于复杂度值来测量3D模型的视觉复杂度,我们可以动态的决定表示视图的数目。最终,我们基于视点熵值采用Fuzzy C-means来聚类采样视图。我们在最新的两个3D模型检索数据库上测试了我们的算法并与其他四个先进的方法进行比较。结果显示我们的算法具有较好的性能。

1.introduction:

使用草图来检索相关3D模型对用户来说是一个直观且简单的方法。对于场景建模或者识别类似的应用是很有用的。

目前,有一些基于草图的3D模型检索算法被提出来。但是这些方法大多是用3D模型预定义的采样视图来和2D草图作比较来进行的。但是,这些采样的策略不能保证提取的采样视图足够能描绘3D模型,因为他们没有考虑不同的模型具有不同的复杂度。事实上,没有必要对例如球或者正方体这样简单的模型来比较13或者14个视图,更多的视图需要从复杂的模型上采样得到。这就是说,我们需要一个可以调整的采样策略。

基于上面的发现,我们提出通过3D模型的视觉复杂度(基于视觉信息的形状复杂度的度量)来决定不同数目的表示视图。提出了一个新颖的基于3D模型均匀采样视图的视觉熵分布的3D视觉复杂度度量。更进一步地采用Fuzzy C-Means方法来有视点熵的值来确定聚类中心数目。然后,形状上下文匹配算法用2D草图和3D模型的各个表示视图之间的匹配上。我们的算法试验在两个最近的3D模型检索库上,被证明是有效的。

这篇论文的主要贡献是以下三个方面:

<1>量化地研究了3D模型的复杂度问题。基于此,我们通过度量信息论相关的视点熵提出了一个有效的3D视觉复杂度度量。

<2>我们提出的方法可以用来调整性的确定每一个3D模型的表示视图的数目。

<3>我们的研究引领了这个问题的研究方向。

2相关工作

2.1基于草图的3D模型检索

基于不同的采样策略,可以将基于草图的3D模型检索技术分为两类:从预定义的固定视点来匹配草图;通过聚类来得到视图从而进行匹配。

用预定义的视图。像上面所提到的,大多数存在的基于草图的3D模型检索算法是通过一系列从预先定义的方向得到的视图进行比较的。【前人所做相关工作】

这些策略的缺点是忽视了他们的表示模型只是从选定的视图来表示的。这也驱使我们开发动态地聚类采样视图的基于草图的检索算法。

用聚类视图。相比于基于预定义视图的方法,基于视图聚类的策略的研究工作就更少了。【前人所做相关工作】

2.2形状复杂度

几何复杂度的方法由Rossignac从五个方面归纳:代数、拓扑、形态、组合和表示。目前,一个新的趋势是度量3D模型的视觉复杂性。这同样在计算机视觉和3维人体感知上有基础:一个3D物体可以被看成是2D视图的一个集合。使用信息论来度量3D模型复杂度也和人类感知相一致。

使用信息论相关的度量来特征化3D模型的采样视图的视觉信息特征被认为是一个有效的方法,因此对于3D形状复杂度的测量也是有用的。Vazquez等提出视点熵来描绘一个视图包含的信息的数目,基于此,他们开发了自动找到视点熵值较大的视图集合的方法。

3视点熵分布-基于视图聚类

在这篇论文中,我们提出了一种基于一系列视图的视点熵分布的3D视觉复杂度的度量。然后,我们采用3D视觉复杂度度量到我们的基于草图的3D模型检索算法中来决定3D模型表示视图(也就是聚类中心)的数目。最后,基于采样视图的视点熵的值,Fuzzy C-Means算法被用来为每一个模型选择表示视图的数目。

视点熵分布。我们采用Loop分解算法来将一个单位正二十面体(用L0表示)分解n次,分解后的形状结果用Ln表示。所有的3D模型都首先被缩放到单位球上然后在3D绘制的时候获取他的正交投影。我们采用引文[TFTN05]中的视点熵计算方法。也就是对与有m个面的3D模型,他的其中一个视图的视点熵是按下面定义的。

                

其中,Aj是3D模型的第j个面的可视投影面积,A0是背景面积。S是窗口的总面积,模型是按照

来计算总面积的。

时间: 2024-07-31 08:02:30

[论文]Sketch-based 3D model retrieval by viewpoint entropy-based adaptive view clustering的相关文章

6D姿态估计从0单排——看论文的小鸡篇——Model Based Training, Detection and Pose Estimation of Texture-Less 3D Objects in Heavily Cluttered Scenes

这是linemod的第二篇,这一篇把训练从online learning 变成了 使用3D model, 并且对于检测结果用 3种方法: color.Pose.Depth来确保不会有false positive.感觉有种不忘初心的感觉(笑 基于linemod,是前一篇的改良 initial version of LINEMOD has some disadvantages. First, templates are learnede online, which is difficule to c

WPF 3D model - Sphere, Cone, and Cylinder

原文:WPF 3D model - Sphere, Cone, and Cylinder ? Extending Visual3D - Sphere, Cone, and Cylinder http://blogs.msdn.com/b/danlehen/archive/2005/10/16/481597.aspx ? He?put together a short sample which derives a Sphere, a Cone, and a Cylinder primitive f

[论文]A survey on partial retrieval of 3D shape

摘要:论文总结了近十年来partial retrieval of 3D shape的进展,给初学者一个初步的概念,并且将现有的方法按照不同的策略分类并分析了这些方法的特点,最后讨论了今后的发展方向. 1 绪论 介绍了partial retrieval的用途和研究进展,给出了流行的数据库.简要描述了global matching和partial matching的区别,也就是global  matching考虑的是全局相似性,而partial matching忽略全局相似性而关注部分相似性.所以p

pytorch --Rnn语言模型 -- 《Recurrent neural network based language model》

论文通过实现RNN来完成了文本分类. 论文地址:88888888 模型结构图: 原理自行参考论文,code and comment: 1 # -*- coding: utf-8 -*- 2 # @time : 2019/11/9 15:12 3 4 import numpy as np 5 import torch 6 import torch.nn as nn 7 import torch.optim as optim 8 from torch.autograd import Variable

IsoAlgo3d - A PCF 3D Viewer for Desktop, Tablet and Smart phone

IsoAlgo3d - A PCF 3D Viewer for Desktop, Tablet and Smart phone [email protected] Abstract. IsoAlgo3d 通过将PCF三维可视化,并导出HTML文件.由于使用WebGL技术,所以只要设备支持HTML5,就可以不用安装任何软件或插件直接浏览PCF对应的全尺寸标注的管道三维模型,不管是电脑.平板还是智能手机.三维直接浏览管道模型,更加直观,避免了二维ISO图有时表达不清晰的情况,如环管出图,复杂管线分图

Bag of Features (BOF)图像检索算法

1.首先,我们用surf算法生成图像库中每幅图的特征点及描述符. 2.再用k-means算法对图像库中的特征点进行训练,生成类心. 3.生成每幅图像的BOF,具体方法为:判断图像的每个特征点与哪个类心最近,最近则放入该类心,最后将生成一列频数表,即初步的无权BOF. 4.通过tf-idf对频数表加上权重,生成最终的bof.(因为每个类心对图像的影响不同.比如超市里条形码中的第一位总是6,它对辨别产品毫无作用,因此权重要减小). 5.对query进来的图像也进行3.4步操作,生成一列query图的

sketch 相关论文

sketch 相关论文 Sketch Simplification We present a novel technique to simplify sketch drawings based on learning a series of convolution operators. In contrast to existing approaches that require vector images as input, we allow the more general and chal

A real sense 3D face reconstruction system based on multi-view stereo vision

Abstract This paper proposed a system for a real sense 3D facial reconstruction method based on multi-view stereo vision generated using an orthographic 3D model. Multi-view stereopsis is an effective technology for expanding perspective and reducing

{ICIP2014}{收录论文列表}

This article come from HEREARS-L1: Learning Tuesday 10:30–12:30; Oral Session; Room: Leonard de Vinci 10:30  ARS-L1.1—GROUP STRUCTURED DIRTY DICTIONARY LEARNING FOR CLASSIFICATION Yuanming Suo, Minh Dao, Trac Tran, Johns Hopkins University, USA; Hojj