Lucene 个人领悟 (二)

想了想,还是继续写吧,因为,太无聊了,媳妇儿也还有半个小时才下班。

前面拖拖拉拉用了三篇文章来做铺垫,这一篇开始正经搞了啊。

首先,我要加几个链接

http://www.cnblogs.com/xing901022/p/3933675.html

这篇文章太屌了,写得非常好,另外那个PPT也建议大家仔细看看,非常好,very棒。

嗯,接下来,应该干啥呢,应该写代码了!应该写代码了!应该写代码了!重要的事情说三遍。

说的再多都不如搞起来,不是有句话说吗?talk is expensive,show me the code。对吧。

从哪说呢?

首先,我用的是今天之前的最新版本 6.5.1, shit,刚才看maven的时候他们竟然又上传了 6.6.0的版本,不重要,差的估计不多,看来美国的大兄弟们也是很努力的呀,人家都那么叼了,还在努力,我们,唉。算了,继续装逼吧。

这一次,贴代码了,不截图了。首先maven配置:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.muyi.lucene</groupId>
    <artifactId>mavenlucene6</artifactId>
    <version>0.0.1-SNAPSHOT</version>
    <packaging>jar</packaging>

    <name>mavenlucene</name>
    <url>http://maven.apache.org</url>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <dependencies>

        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-core</artifactId>
            <version>6.5.1</version>
        </dependency>

        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-highlighter</artifactId>
            <version>6.5.1</version>
        </dependency>

        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-analyzers-common</artifactId>
            <version>6.5.1</version>
        </dependency>

        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-memory</artifactId>
            <version>6.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-queryparser</artifactId>
            <version>6.5.1</version>
        </dependency>
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>3.8.1</version>
            <scope>test</scope>
        </dependency>

        <dependency>
            <groupId>net.sourceforge.jexcelapi</groupId>
            <artifactId>jxl</artifactId>
            <version>2.6.12</version>
        </dependency>

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>3.9</version>
        </dependency>

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-scratchpad</artifactId>
            <version>3.2-FINAL</version>
        </dependency>

        <dependency>
            <groupId>com.janeluo</groupId>
            <artifactId>ikanalyzer</artifactId>
            <version>2012_u6</version>
        </dependency>

        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-analyzers-smartcn</artifactId>
            <version>6.5.1</version>
        </dependency>
        <dependency>
            <groupId>org.apache.lucene</groupId>
            <artifactId>lucene-backward-codecs</artifactId>
            <version>6.5.1</version>
        </dependency>
    </dependencies>
</project>

没有注释,是吧,关键我不知道写啥呀,ikanalyzer这个是IK分词器,这个坐标是在百度经验里面找到的,lucene-analyzers-smartcn这个也是中文分词器,其他的就是jxl和poi的包了,反正我写的就是需要这么多依赖。

然后,我们就要开始coding了,好累呀,明天再写吧。

时间: 2024-10-13 11:21:38

Lucene 个人领悟 (二)的相关文章

lucene学习笔记(二)

package index; import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Document; import org.apache.lucene.document.Field; import org.apache.lucene.index.CorruptIn

Lucene基础(二)--索引的操作

索引的操作 我们建立所有就是要达到快速检索的目的,对数据能够方面便的查找,和数据库类似,索引也有自己的相关增删改查的操作. 在索引的增删改查中,增删改属于写操作,主要是有IndexWrite提供的方法处理:而查显而易见,读操作,使用IndexSeacher 提供的方法来实现.在Lucene的官方文档找到 org.apache.lucene.index.IndexWriter 这个类,我们就可以看到他很多方法. 创建索引 如同上一章里面的代码,创建索引时先建立文件,创建索引的域,再使用IndexW

lucene学习笔记二(基于数组的lucene检索,索引删除)

构建数组: private String[] ids = {"1","2","3","4","5","6"}; private String[] emails = {"[email protected]","[email protected]","[email protected]","[email protected

学习Lucene.net(二)

几种分析器的差异展示: 学习了birdshover的博客. private void button3_Click(object sender, EventArgs e) { string testwords = "我是中国人,I can speak chinese!"; List<Analyzer> analysis = new List<Analyzer>() { new KeywordAnalyzer(), new SimpleAnalyzer(), new

Lucene 个人领悟 (三)

其实接下来就是贴一下代码,熟悉一下Lucene的正常工作流程,或者说怎么使用这个API,更深层次的东西这篇文章不会讲到. 上一篇文章也说了maven的配置,只要你电脑联网就可以下载下来.我贴一下代码. package com.muyi.lucene.mavenlucene.Ltest; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.FileRea

Lucene 学习之二:数值类型的索引和范围查询分析

Lucene   使用的是字符(词)类型的索引结构.对数值类型的索引和存储最终都要先转成字符类型. 早期版本Lucene 没有封装数值类型的公共类.需要先直接将数字转成字符串再加到Field 中. JAVA代码: 1 Document doc = new Document(); 2 long i = 123456L; 3 doc.Add(new Field("id", String.valueOf(i), Field.Store.YES, Field.Index.YES)); 4 wr

lucene 实战(二)lucene 索引

lucene是一个提供搜索的工具,并不能实现内容的抓取.所有内容的获取完全依赖于自己的应用程序去实现或者第三方的工具来做.在apache lucene下面有一个子项目,Solr可以实现从关系型数据库中获取原始数据.只要拿到原始的文本数据,lucene就可以负责建立相关的索引. 创建索引 1.Field.Store.YES (NO) 存储域选项 设置为Y表示把这个域中的内容完全存储到文件中,方便进行文本的还原 设置为N表示把这个域的内容不存储到文件中,但是可以被索引,此时内容无法完全还原 2.Fi

使用Lucene.Net实现全文检索

目录 一 Lucene.Net概述 二 分词 三 索引 四 搜索 五 实践中的问题 一 Lucene.Net概述 Lucene.Net是一个C#开发的开源全文索引库,其源码包括“核心”与“外围”两部分.外围部分实现辅助功能,而核心部分包括: Lucene.Net.Index 提供索引管理,词组排序. Lucene.Net.Search 提供查询相关功能. Lucene.Net.Store 支持数据存储管理,主要包括I/O操作. Lucene.Net.Util 公共类. Lucene.Net.Do

(转)Lucene中文分词图解

本文记录Lucene+Paoding的使用方法图解: 一.下载Lucene(官网:http://archive.apache.org/dist/lucene/java/)本文中使用的是:2.9.4,下载后解压,Lucene所需要的基本jar文件如下列表: lucene-core-2.9.4.jar                   Lucene核心jar lucene-analyzers-2.9.4.jar            Lucene分词jar lucene-highlighter-2