简单全文检索

public static void main(String[] args) throws IOException, ParseException {

Analyzer analyzer = new StandardAnalyzer(Version.LUCENE_CURRENT);
// Store the index in memory:
Directory directory = new RAMDirectory();
// To store an index on disk, use this instead:
// Directory directory = FSDirectory.open(new File("C:/luceneIndex"));
IndexWriterConfig config = new IndexWriterConfig(Version.LUCENE_CURRENT, analyzer);
IndexWriter iwriter = new IndexWriter(directory, config);
DirectoryReader ireader = DirectoryReader.open(directory);
Document doc = new Document();
String text = "doc"
+ "cgp 陈桂萍 to be text";
doc.add(new Field("fieldname", text, TextField.TYPE_STORED));
iwriter.addDocument(doc);
iwriter.close();
System.out.println("建立索引 ok");
// Now search the index:
IndexSearcher isearcher = new IndexSearcher(ireader);
// Parse a simple query that searches for "text":
QueryParser parser = new QueryParser(Version.LUCENE_CURRENT, "fieldname", analyzer);
Query query = parser.parse("陈桂");
ScoreDoc[] hits = isearcher.search(query, null, 1000).scoreDocs;
System.out.println(hits.length == 1);
// Iterate through the results:
for (int i = 0; i < hits.length; i++) {
Document hitDoc = isearcher.doc(hits[i].doc);
System.out.println(hitDoc.get("fieldname"));
}
ireader.close();
directory.close();

时间： 2024-12-14 18:42:40

简单全文检索的相关文章

mysql全文检索简单应用

需求是这样的:项目中有一张模板表,模板项中有个大字段,存放这个模板具体的模板项信息以json字符串形式存放在该字段中,这样的好处是只有一张表,不用维护传统的模板表和模板项这两张表,而且查询时候的效率更高,应该只查询一张表嘛.不用进行连表查询.当然带来的缺点就是如果存在以模板项这个大字段的条件查询会很不方便.一开始经过讨论决定该字段制作保存和读取不存在针对该字段的条件查询,所有就这么做了. 但是后面由于需求的进一步细化,有个这么个需求: 当客户选择了具体的模板项后,要先查询之前的模板是否存在相同的

全文检索技术---Lucene

1 Lucene介绍 1.1 什么是Lucene Lucene是apache下的一个开源的全文检索引擎工具包.它为软件开发人员提供一个简单易用的工具包(类库),以方便的在目标系统中实现全文检索的功能. 1.2 全文检索的应用场景 1.2.1 搜索引擎 ©注意: Lucene和搜索引擎是不同的,Lucene是一套用java或其它语言写的全文检索的工具包.它为应用程序提供了很多个api接口去调用,可以简单理解为是一套实现全文检索的类库.搜索引擎是一个全文检索系统,它是一个单独运

全文检索技术---solr

1 Solr介绍 1.1 什么是solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器.Solr可以独立运行在Jetty.Tomcat等这些Servlet容器中. Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展,并对索引.搜索性能进行了优化. 使用Solr 进行创建索引和搜索索引的实现方法很简单,如下: l 创建索引:客户端(可以是浏览器可以是Java程序)用 POST 方法向 Solr 服务器发

MySQL 全文搜索支持, mysql 5.6.4支持Innodb的全文检索和类memcache的nosql支持

背景:搞个个人博客的全文搜索得用like啥的,现在mysql版本号已经大于5.6.4了也就支持了innodb的全文搜索了,刚查了下目前版本号都到MySQL Community Server 5.6.19 了,所以,一些小的应用可以用它做全文搜索了,像sphinx和Lucene这样偏重的.需要配置或开发的,节省了成本. 这儿有一个原创的Mysql全文搜索的文章, mysql的全文搜索功能:http://blog.csdn.net/bravekingzhang/article/details/672

hdu 1277 全文检索

题目连接 http://acm.hdu.edu.cn/showproblem.php?pid=1277 全文检索 Description 我们大家经常用google检索信息,但是检索信息的程序是很困难编写的:现在请你编写一个简单的全文检索程序.问题的描述是这样的:给定一个信息流文件,信息完全有数字组成,数字个数不超过60000个,但也不少于60个:再给定一个关键字集合,其中关键字个数不超过10000个,每个关键字的信息数字不超过60个,但也不少于5个:两个不同的关键字的前4个数字是不相同的:由于

HDU 1277 全文检索 (Trie树应用好题)

全文检索 Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) Total Submission(s): 1304 Accepted Submission(s): 416 Problem Description 我们大家经常用google检索信息,但是检索信息的程序是很困难编写的:现在请你编写一个简单的全文检索程序. 问题的描述是这样的:给定一个信息流文件,信息完全有数字组成,

solr 简单搭建数据库数据同步（待续）

原来在别的公司负责过文档检索模块的维护(意思就是不是俺开发的啦).所以就稍微接触和研究了下文档检索. 文档检索其实是全文检索,是通过一种技术把N多文档进行一定规律的切割归类,然后创建易于搜索的索引式文件,然后搜索具有某些规律的文档时,能够通过快速定位索引,然后根据索引提供的信息精确定位到文档从而实现迅速找到文档.这个文档一般成为条目. 上家公司的时候使用的是Lucene加上Zoie实现的.lucene是apache下的开源项目,不过并不是全文检索的实现,而是一个全文检索的引擎,是一个架构,是其他

Lucene学习总结之一：全文检索的基本原理

一.总论根据http://lucene.apache.org/java/docs/index.html定义: Lucene是一个高效的,基于Java的全文检索库. 所以在了解Lucene之前要费一番工夫了解一下全文检索. 那么什么叫做全文检索呢?这要从我们生活中的数据说起. 我们生活中的数据总体分为两种:结构化数据和非结构化数据. 结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据等. 非结构化数据:指不定长或无固定格式的数据,如邮件,word文档等. 当然有的地方还会提到第三种,半

Lucene：基于Java的全文检索引擎简介 (zhuan)

http://www.chedong.com/tech/lucene.html ********************************************** Lucene是一个基于Java的全文索引工具包. 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示 Hacking Lucene:简化的查询分析器,删除的

猜你喜欢

ML1

Supervised Learning In supervised learning, we are given a data set and already know what our correc ...

java 第58节线程同步问题的由来

2016-07-01 package com.java1995; /** * 打印机类 * @author Administrator * */ public class Print { /** * ...

LinkedList

LinkedList是基于链表结构的一种List,在分析LinkedList源码前有必要对链表结构进行说明. 1.链表的概念链表是由一系列非连续的节点组成的存储结构,简单分下类的话,链表又分为单向链 ...

多内存管理

1.有alloc,new,copy创建出来的对象就必须有release,在类中是retain对oc类型对成员在该类对dealloc方法中也要release 2.一旦对象直接有引用关系,那么就一定有re ...

servlet执行流程

视频地址:http://www.imooc.com/video/5550 1-6 用户点击超链接,服务器根据此链接,在web.xml文件的<servlet-mapping>标签 ...

有漏洞无作为才可怕、可耻！

安全问题: 是否有权限进行CURD,因为参数在地址栏里,是可以修改的,(或参数在html页面里,可以用firebug修改源码),所以进行CURD之前要先查询该操作人是否拥有这条记录,比如:根据门店ID ...

网站防刷方案 -摘自网络

1. 访问网站所涉及环节简单说就是重复相同的请求首先看看访问流程所设计的每个环节 User -> Browse -> CDN/Proxy Cache -> Web Server ...

学习心得（8月3日）

学习总结: 这个暑假学习的三门课程已经有一段时间了,它们分别是Linux.java和mysql.我之所以要在暑假期间学习这三门课程,主要是因为这三门课程有很强的联系性. 首先说说Linux. 三门课程 ...

内存问题定位与解决

内存问题定位基本流程: 主要用到的性能计数器 Page life expectancy (数据库计数器:主要显示不被使用的页,将在缓存中停留的秒数 ) Lazy writes/sec (数据库计数器: ...

POJ3264 Balanced Lineup 线段树区间最大值最小值

Q个数问区间最大值-区间最小值 1 // #pragma comment(linker, "/STACK:1024000000,1024000000") 2 #include & ...

IOS键盘弹出文本输入框上移

刚开始做IOS,做的不好,还望朋友们多多指教,谢谢! #import "ViewController.h" @interface ViewController ()<UITe ...

SCCM 2012 R2 Remote tools

在某些情况下,你可能需要ServiceDesk或技术支持人员运行Configuration Manager2012,而不想在其计算机安装管理控制台,并授予他们以使用管理控制台的权限.那就是使用sccm ...

一次Linux服务器木马查杀经历

1客户自己的服务器由于种了木马,往外发送大量数据包,被服务商切断网络.虽然没有网络不能直接登录服务器,但是可以通过服务商提供的WEB控制面板进入操作系统.首先使用命令查看相关连接:netstat -n ...

Discuz随机默认头像

当用户在Discuz没有上传自己的头像,显示的是默认头像,那么可不可以让这个默认头像随机显示了,答案是可以的,实现起来也比较简单,如果你熟悉php的随机函数rand()的话. 先准备几张自己需要的默认 ...

概念：名与实

概念的名称是人类联系意识与实体的桥梁:通常一个概念的名字能够反映这个概念的大概含义.比如 "概念":从字面意思来看,"概"是大略.总括的意思:念:心中的打算,想 ...

TOJ1420

1 #include<iostream> 2 #include<string> 3 using namespace std; 4 int main() 5 { 6 string ...

FR #12题解

A. 我的做法是nmlogn的....直接做m次堆贪心就可以.按理说是能过的... 正解直接是在原dp上搞一搞...可以做到n^2+nlog? 2333 #include<iostream> ...

使用DD_belatedPNG让IE6支持PNG透明图片

众所周知IE6不支持透明的PNG图片,而PNG图片在Web设计方面表现力上,具有其它图形格式所达不到的效果,IE6这一致命缺陷极大地限制了Web设计的创意发挥.虽然解决IE6的透明PNG的方法也很多, ...

C++模板实参推断

1 类型转换与模板实参 1)自动转换的只有:const转换, 数组及函数到指针的转换注:不同大小相同元素类型是不同的类型 2)相同模板参数名对应的实参类型必须相同 3)不同模板参数名对应的实参类型可 ...

Spring Security简明实践及相关国际化处理

别人的都是最佳实践,因为我目前的设置没有按照参考文档推荐,还是采用DelegatingFilterProxy,所以我只能说简明实践.先贴我的applicationContext-security.xm ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.