利用Lucene测试索引生成的segment.fnm文件所包含的内容(详解)

/*

*

* 这段代码用来测试文件segment.fnm文件所包含的内容

* .fnm包含了Document中的所有field名称

 * */

生成的索引文件.fnm中所包含了Document的所有Field名称。

如图就是生成索引,打开所显示的文件。

package segment;

import java.io.IOException;

import org.apache.lucene.analysis.standard.StandardAnalyzer;

import org.apache.lucene.document.Document;

import org.apache.lucene.document.Field;

import org.apache.lucene.index.IndexWriter;

public class Segment {

private String INDEX_PATH = "E:\\Lucene项目\\索引文件";

Document doc1 = null;

Document doc2 = null;

public Segment(){

try

{ doc1 = new Document();

Field f1 = new Field("name1", "smi steve ted teddy terry", Field.Store.YES, Field.Index.TOKENIZED);

Field f2 = new Field("name2", "what are you doing", Field.Store.YES, Field.Index.TOKENIZED);

Field f3 = new Field("name3", "how do you do", Field.Store.YES, Field.Index.TOKENIZED);

doc1.add(f1);

doc1.add(f2);

doc1.add(f3);

doc2 = new Document();

Field f4 = new Field("name4", "smi steve ted teddy terry", Field.Store.YES, Field.Index.TOKENIZED);

Field f5 = new Field("name4", "what are you doing", Field.Store.YES, Field.Index.TOKENIZED);

doc2.add(f4);

doc2.add(f5);

IndexWriter writer = new IndexWriter(INDEX_PATH, new StandardAnalyzer(), true);

writer.setUseCompoundFile(false);

writer.addDocument(doc1);

writer.addDocument(doc2);

writer.close();

}catch(IOException e){

e.printStackTrace();

}

}

public static void main(String[] args) {

// TODO Auto-generated method stub

Segment se = new Segment();

}

}

时间: 2024-08-15 16:01:54

利用Lucene测试索引生成的segment.fnm文件所包含的内容(详解)的相关文章

Windows主机里利用VMware安装Linux(CentOS)虚拟机,Host-only连接上网方式详解

关于Host-only指的是主机与虚拟机之间的互联,因此虚拟机是不能连网的,若需要连网则需要使用NAT模式: Host-only模式实现联网得考虑如下配置过程: 附:VMware虚拟机三种网络模式(Bridged,Nat,Host-only)区别详解 VMware的几个虚拟设备 VMnet0:用于虚拟桥接网络下的虚拟交换机 VMnet1:用于虚拟Host-Only网络下的虚拟交换机 VMnet8:用于虚拟NAT网络下的虚拟交换机 VMware Network Adepter VMnet1:Hos

【框架】[Hibernate]构架知识点详解入门与测试实例

转载请注明出处:http://blog.csdn.net/qq_26525215 本文源自[大学之旅_谙忆的博客] Hibernate介绍: Hibernate是一个开放源码的.非常优秀.成熟的O/R Mapping框架.它提供了强大.高性能的Java对象和关系数据的持久化和查询功能. O/R Mapping 对象关系映射(Object Relational Mapping,简称ORM)技术,是通过使用描述对象和数据库之间映射的元数据,将Java程序中的对象自动持久化到关系数据库中. 对象和关系

利用mnist训练集生成的caffemodel对mnist测试集与自己手写的数字进行测试

从一到二:利用mnist训练集生成的caffemodel对mnist测试集与自己手写的数字进行测试 通过从零到一的教程,我们已经得到了通过mnist训练集生成的caffemodel,主要包含下面四个文件: 接下来就可以利用模型进行测试了.关于测试方法按照上篇教程还是选择bat文件,当然python.matlab更为方便,比如可以迅速把识别错误的图片显示出来. 一.均值文件mean.binaryproto 在进行分类之前首先需要产生所有图片的平均值图片,真正分类时的每个图片都会先减去这张平均值图片

利用微软测试工具PICT生成测试用例

---恢复内容开始--- 这里使用一个登陆界面的测试作为例子,程序流程中共有5项待测环节. 1.首先,列出每个条目所需进行测试的分支: 1 账户名:空,不存在,超长,超短,正常 2 密码:空,超长,超短,不匹配,正常 3 验证码:空,超长,超短,不匹配,正常 4 会话:保存一个月,保存三个月,保存一年,不保存 5 按钮:确定,取消 2.下载PICT工具后,进行安装.在安装目录下,新建txt文件,输入上述内容. 3.打开cmd,进入PICT工具安装目录,并运行pict test.txt>test.

利用Lucene的IndexWriter建立索引(详解)

/* * 建立索引,然后把建立后的文档添加到索引中去 * 提示先使用Document和Field把Field加入到Document中去, * 接着把Document建立成为一个索引 * */ package comThree; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; imp

UI测试后生成测试报告,利用shell脚本上传svn

ui测试后生成测试报告,把报告保存在某一个固定路径 shell脚本把这个报告上传 #!/bin/bash -ile #svn下载文件 #svn checkout http://svn.xxx.com/svn/xxxx/trunk/UI/report --username xxx --password dsdfsdf; svn checkout http://svn.xxx.com.cn/svn/xxxx/trunk/UI/report cd report pwd #是否存在report 文件,如

Solr4.8.0源码分析(10)之Lucene的索引文件(3)

Solr4.8.0源码分析(10)之Lucene的索引文件(3) 1. .si文件 .si文件存储了段的元数据,主要涉及SegmentInfoFormat.java和Segmentinfo.java这两个文件.由于本文介绍的Solr4.8.0,所以对应的是SegmentInfoFormat的子类Lucene46SegmentInfoFormat. 首先来看下.si文件的格式 头部(header) 版本(SegVersion) doc个数(SegSize) 是否符合文档格式(IsCompoundF

Lucene学习之四:Lucene的索引文件格式(2)

本文转载自:http://www.cnblogs.com/forfuture1978/archive/2009/12/14/1623599.html  略有删减和补充 四.具体格式 上面曾经交代过,Lucene保存了从Index到Segment到Document到Field一直到Term的正向信息,也包括了从Term到Document映射的反向信息,还有其他一些Lucene特有的信息.下面对这三种信息一一介绍. 4.1. 正向信息 Index –> Segments (segments.gen,

Lucene -- 实时索引

lucene的实时搜索可以分成:实时和近实时的搜索. 实时只能依靠内存了. 近实时可以用lucene中提供org.apache.lucene.index.DirectoryReader.open(IndexWriter writer, boolean applyAllDeletes) throws IOException,可以在不十分影响性能的前提下,实现近实时的效果(比如每1s打开一次搜索,这类似于solr中的实现). 一.实时搜索 lucene一般有ramdirectory和fsddirec