Solr4+IKAnalyzer的安装配置

solr本身对中文分词的处理不是太好，所以中文应用很多时候都需要额外加一个中文分词器对中文进行分词处理，ik-analyzer就是其中一个不错的中文分词器。

1.版本信息

　　solr版本：4.7.0

　　需要ik-analyzer版本：IK Analyzer 2012FF_hf1

2.配置步骤

下载压缩解压后得到如下目录结构的文件夹：

我们把IKAnalyzer2012FF_u1.jar拷贝到solr服务的solr\WEB-INF\lib下面。

我们把IKAnalyzer.cfg.xml、stopword.dic拷贝到需要使用分词器的core的conf下面，和core的schema.xml文件一个目录。

修改core的schema.xml，在<types></types>配置项间加一段如下配置：

　　<fieldType name="text_ik" class="solr.TextField">
         <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
         <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
    </fieldType>
或

　　<fieldType name="text_ik" class="solr.TextField">
    　　<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
　　</fieldType>

我们就多了一种text_ik的field类型了，该类型使用的分词器就是ik-analyzer。

我们在这个core的schema.xml里面配置field类型的时候就可以使用text_ik了。

<field name="name"      type="text_ik"   indexed="true"  stored="true"  multiValued="false" />

3.中文分词测试

时间： 2024-12-22 10:22:51

Solr4+IKAnalyzer的安装配置的相关文章

【转载】Solr4+IKAnalyzer的安装配置

转载:http://www.cnblogs.com/madyina/p/4131751.html 一.下载Solr4.10.2 我们以Windows版本为例,solr-4.10.2.zip是目前最新版本,下载地址: http://www.apache.org/dyn/closer.cgi/lucene/solr/4.10.2 二. Solr安装: 1.解压solr-4.10.2.zip 2.将 solr-4.10.2/example/webapps/solr.war 拷贝到Tomcat的we

solr4.8的安装,配置,使用,搜索,推荐及看法

solr4.9发布了,用一个网友的意思,现在solr绝壁是Firefox之外最大的版本帝.公司的solr版本是4.0,这几天决定给升级到4.8(4.9在maven上资源还不够),抽时间在整理下分布式solr. 今天先把solr4.8安装过程写下来,其实和4.0区别不大. 1,环境必须是tomcat7.0以上,jdk7.0以上,jre7.0以上,且配置好环境变量: 2,example\webapps 下的solr.war: 3,solr home,并配置web.xml: 4,拷贝exa

elasticsearch系列一：elasticsearch（ES简介、安装&配置、集成Ikanalyzer）

一.ES简介 1. ES是什么? Elasticsearch 是一个开源的搜索引擎,建立在全文搜索引擎库 Apache Lucene 基础之上用 Java 编写的,它的内部使用 Lucene 做索引与搜索,但是它的目的是使全文检索变得简单, 通过隐藏 Lucene 的复杂性,取而代之的提供一套简单一致的 RESTful API. Elasticsearch 不仅仅只是一个全文搜索引擎. 它可以被下面这样准确的形容: 一个分布式的实时文档存储,每个字段可以被索引与搜索--作数据库用一个分布式实

elasticsearch系列一elasticsearch（ES简介、安装&配置、集成Ikanalyzer）

安装配置apache-solr（使用apache-tomcat容器）

1.安装配置tomcat: 略 2.访问一下,看tomcat有没安装配置成功如果成功的话开始配置solr服务器(企业应用搜索服务器): tar fvxz solr-4.8.1.tgz 拷贝solr.war到tomcat目录: cp -fr solr-4.8.1/example/webapps/solr.war /app01/tomcat-8.0.8/webapps/ 创建solr主目录并拷贝文件 mkdir /app01/tomcat-8.0.8/solrhome cp -a solr-4.8

elasticsearch的安装配置以及初步使用

elasticsearch 是一个全文搜索引擎,支持分布式.搜索速度非常快速. 本文主要进行了 elasticsearch 的安装配置以及初步的使用功能: -- 下载放到 /data/soft 目录 wget https://download.elasticsearch.org/elasticsearch/release/org/elasticsearch/distribution/tar/elasticsearch/2.1.0/elasticsearch-2.1.0.tar.gz--

ElasticSearch笔记整理（一）：简介、REST与安装配置

[TOC] ElasticSearch简介 ElasticSearch是一款基于Apache Lucene构建的开源搜索引擎,它采用Java编写并使用Lucene构建索引.提供搜索功能,ElasticSearch的目标是让全文搜索变得简单,开发者可以通过它简单明了的RestFul API轻松地实现搜索功能,而不必去面对Lucene的复杂性.ES能够轻松的进行大规模的横向扩展,以支撑PB级的结构化和非结构化海量数据的处理. 一言以蔽之:ElasticSearch是一款基于Lucene的实时分布式搜

Centos7:Solr安装,配置与使用

Centos7:Solr安装,配置与使用配置jdk环境,安装tomcat 解压solr bin:是脚本的启动目录 contrib:第三方包存放的目录 dist:编译打包后存放目录,即构建后的输出产物存放的目录 docs:solr文档的存放目录 example:示范例子的存放目录 licenses:权限相关的部署solr工程将/example/webapps/下的工程部署到Tomcat下把solr源码包下的/example/lib/ext目录下的所有的jar包,添加到solr工程中. 创建

CentOS 6.9中Telnet的安装配置

Telnet:TCP/IP协议中的一员,是Internet远程登录服务的标准协议和主要方式.它为用户提供了在本地计算机上完成远程主机工作的能力.要开始一个Telnet会话,必须输入用户名和密码来登录服务器.Telnet是常用的远程控制Web服务器的方法,监听TCP的23号端口. xinetd:新一代的网络超级守护进程,经常用来管理多种轻量级的Internet服务.xinetd提供类似于inetd+tcp_wrapper的功能,但它更强大更安全.xinetd能够同时监听多个指定的端口,在接受用户请