Lucene 学习之一:源码环境搭建

一直想抽点时间系统的学习下Lucene ,今天把Lucene 源码学习环境搭建了一下。下面描述一下环境搭建过程。

开发环境的配置(lucene-4.10.2 + Eclipse):

1:下载最新源码:把jar包lucene-4.10.2,和java源码lucene-4.10.2-src 都下载下来。

下载地址:http://mirror.bit.edu.cn/apache/lucene/java/4.10.2/

2:在Eclipse 安装lucene-4.10.2 java源码。

新建JAVA 项目,把“使用缺省位置的勾去掉”。选择源码文件目录。

项目加载进来后会有很多错误提示,这是因为还有很多依赖包没有引用到。

解决办法,把jar包lucene-4.10.2 各文件夹下面的lib 文件下面的jar 包都拷贝出来。

在项目中建一个lib 文件夹。把所以的jar 包复制过来。然后,把所以jar 包添加到构建路径。居然有这么多包。

lucene-4.10.2-src\lucene-4.10.2\demo\src\java\org\apache\lucene\demo 这个目录下有两个简单实例,分别是建索引 和 查询 。

新建一个JAVA 项目,并在构建项目中添加lucene-4.10.2的引用。

下面可以自己尝试写demo了。

下面是一个建索引的例子:

package index.demo;

import java.io.File;
import java.io.IOException;
import java.util.*;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.LongField;
import org.apache.lucene.document.StringField;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.index.IndexWriterConfig.OpenMode;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.FSDirectory;
import org.apache.lucene.util.Version;

import index.bean.*;

/**
 * @author zhangrh 索引构建类
 */
public class IndexBuilder {

    private IndexBuilder() {
    }

    /**
     * 索引初始化
     */
    public static void initIndex() {
        try {

            String indexPath = "D://lucene/index";

            Directory dir = FSDirectory.open(new File(indexPath));

            Analyzer analyzer = new StandardAnalyzer();

            IndexWriterConfig iwc = new IndexWriterConfig(
                    Version.LUCENE_4_10_2, analyzer);

            iwc.setOpenMode(OpenMode.CREATE);

            IndexWriter writer = new IndexWriter(dir, iwc);

            ArrayList<Hotel> hotelList = getContentData();

            if (hotelList != null) {

                for (Hotel h : hotelList) {

                    Document doc = new Document();

                    LongField idField = new LongField("id", h.getId(),
                            Field.Store.YES);

                    doc.add(idField);

                    Field nameCNField = new StringField("name", h.getNameCN(),
                            Field.Store.YES);

                    doc.add(nameCNField);

                    Field nameENField = new StringField("ename", h.getNameEN(),
                            Field.Store.YES);

                    doc.add(nameENField);

                    writer.addDocument(doc);
                }

            }

            writer.close();

        } catch (IOException e) {

            // TODO 自动生成的 catch 块
            e.printStackTrace();

        }

    }

    /**
     * 返回 {@link Hotel} 内容数据
     *
     * @return An ArrayList of Hotel
     */
    private static ArrayList<Hotel> getContentData() {

        ArrayList<Hotel> list = new ArrayList<Hotel>();
        return list;
    }

}

官方API说明:http://lucene.apache.org/core/4_10_2/index.html

时间: 2024-10-22 10:26:47

Lucene 学习之一:源码环境搭建的相关文章

opencv2.4.9中stitching_detailed源码环境搭建

今天做了一下老师给的第一套题,第一题是判断一个字符串是否在另一个字符串中:做了一下,感觉有好多种写法,java中的类真的好多啊,要掌握好一些基本类的用法: package com.exam.e120; public class java1 { public static void main(String[]args){ String str1,str2; str1="I am Tom, I am from China."; str2="Tom"; int i=str

Tomcat7源码环境搭建

在网上看了很多有关源码环境搭建的文章,几乎都以失败而告终.好了,废话不多说,下面分享一下我的源码搭建之旅,希望能对热爱分析源码的童鞋有所帮助. Tomcat源码编译需要安装ant,且需要同时安装jdk6和jdk7,,缺一不可. 第一步:去ant官网下载zip格式的安装文件,解压到本地,然后配置好环境变量,具体可以参考网站的资料来做. 第二步:将Tomcat源码解压到本地,然后在根目录找到默认的配置文件:build.properties.default,配置jdk7的路径,这个很重要一定要配置,作

LAMMP源码环境搭建

一.LAMMP环境简介 LAMMP是linux.Apache.Mysql.Memcahed.PHP的首字母缩写 LAMMP网络拓扑图(待补) 工作模式: apache响应回复用户html请求并转发php程序给FastCGI FastCGI把php程序执行结果响应给apache mysql响应用户的数据的写入和查询 memcached根据用户请求的程序决定是否需要memcached服务器将数据缓存至内存中 系统环境: LAMMP分别搭建在4台CentOS6.4.x86_64服务器上并且安装好编译环

【ZooKeeper系列】3.ZooKeeper源码环境搭建

前文阅读: [ZooKeeper系列]1.ZooKeeper单机版.伪集群和集群环境搭建 [ZooKeeper系列]2.用Java实现ZooKeeper API的调用 在系列的前两篇文章中,介绍了ZooKeeper环境的搭建(包括单机版.伪集群和集群),对创建.删除.修改节点等场景用命令行的方式进行了测试,让大家对ZooKeeper环境搭建及常用命令行有初步的认识,也为搭建ZooKeeper的开发环境.生产环境起到了抛砖引玉的作用.也介绍了用Java来实现API的调用,包括节点的增.删.改.查.

Linux Kafka源码环境搭建

本文主要讲述的是如何搭建Kafka的源码环境,主要针对的Linux操作系统下IntelliJ IDEA编译器,其余操作系统或者IDE可以类推. 1.安装和配置JDK确认JDK版本至少为1.7,最好是1.8及以上.使用java -version命令来查看当前JDK的版本,示例如下: [email protected]:~/workspace/software/hadoop-2.7.3/bin$ java -version java version "1.8.0_191" Java(TM)

web应用之LAMP源码环境搭建

目录 一.LAMP环境的介绍   1.LAMP环境的重要性   2.LAMP组件介绍   二.Apache源码安装   1.下载Apache以及相关依赖包   2.安装Apache以及相关依赖包   2-1.安装Apache依赖包   2-2.安装apr   2-3.安装apr-util   2-4.安装pcre   2-5.安装Apache   3.配置Apache   3-1.启动Apache服务   3-2.注册Apache为服务   3-3.加入Apache服务到chkconfig中  

【一步一步】Spring 源码环境搭建

平时项目中基本上都会用到spring,但是源码还没有深入的了解过.趁这段时间稍微空闲点,开始研究下spring 源码.下面是spring 源码的环境搭建. 主要分为如下步骤: ①安装jdk,gradle,git ②从GitHub下载spring framework 代码 ③编译导入ide中. 第一步安装过程略过. jdk安装成功后通过java -v 输出: gradle 安装整个后通过输入gradle -verson 由于我是之前安装过所以版本要老一些. 以及git 以上第一步已经完成了. 第二

Dubbo源码环境搭建

零.前言 Dubbo已由阿里巴巴贡献给Apache基金会,项目托管在github上 一.下载源码 https://github.com/apache/incubator-dubbo.git https://github.com/apache/incubator-dubbo-ops.git https://github.com/apache/incubator-dubbo-spring-boot-project.git 项目说明 : Dubbo Dubbo主项目代码 Dubbo Ops 与Dubb

Spring源码阅读 源码环境搭建(一)

ring 源码阅读的搭建(一) 一 下载spring源码 进入官方网页:https://spring.io/projects/spring-framework 进入相关的github位置,下载zip包 解压: 二 安装Gradle 下载Gradle: 进入下载页面:https://gradle.org/releases/ 配置环境变量: 解压到制定目录下 配置项: GRADLE_HOME: C:\Program Files\gradle-4.10.2 Path中添加:%GRADLE_HOME%\