solr4.10.4 单机安装(并添加dataimport和中文分词器)

安装环境的准备:

(这里直接给相关软件的版本号了)

centos 6.4

apache-tomcat-7.0.57

solr-4.10.4

jdk1.7.0_75

jdk和tomcat这里就不给安装方式了,要是不会直接百度各种有。

具体步骤:

1.下载solr-4.10.4,然后解压开我这里解压到  /usr/local/zip/solr-4.10.4 中(安装目录一般我都会安装在/opt/web_app安装目录自己定义创建)

2.在/opt/web_app下创建solr_server/solr_data和solr_server/solr_home文件夹。

3.拷贝solr.war到solr_server/solr_data中,cp /usr/local/zip/solr-4.10.4/dist/solr-4.10.4.war /opt/web_app/solr_server/solr_data中,并修改名为solr.war

4.拷贝solr_home到solr_server/solr_home中,cp -r /usr/local/zip/solr-4.10.4/example/solr/*  /opt/web_app/solr_server/solr_home中.

5.添加tomcat的支持:

<?xml version="1.0" encoding="UTF-8"?>
<Context docBase="/opt/web_app/solr_server/solr_data/solr" debug="0" crossContext="true">
<Environment name="solr/home" type="java.lang.String" value="/opt/web_app/solr_server/solr_home" override="true"/>
</Context>

启动tomcat解压solr.war到tomcat/webapps 中

这时候启动tomcat会报各种错误但是控制台是看不见的,原因是没有添加logs的支持。

6.添加日志的支持,

cp /usr/local/zip/solr-4.10.4/example/resources/log4j.properties /opt/web_app/tomcat-solr-8084/webapps/solr/WEB-INF/classes

cp /usr/local/zip/solr-4.10.4/example/lib/ext/*/opt/web_app/tomcat-solr-8084/webapps/solr/WEB-INF/lib

重启tomcat,看见控制台有日志输出了吧。

7.添加中文分词器:分词器种类很多这里以mmseg4j为列,分词器性能比较可以看http://www.hansight.com/blog-lucene4.10-with-chinese-segment.html

mmseg4j版本说明,不要下错了哦

* mmseg4j-solr-2.1.0.jar 要求 lucene/solr 4.8.x

* mmseg4j-solr-2.2.0.jar 要求 lucene/solr [4.9, 4.10.x]

* mmseg4j-solr-2.3.0.jar 要求 lucene/solr [5.0, ]

下载好jar导入到/opt/web_app/tomcat-solr-8084/webapps/solr/WEB-INF/lib中

并在/opt/web_app/solr_server/solr_home/collection1/conf/schema.xml中添加如下代码:

<fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
                <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
        </analyzer>
</fieldtype>
<fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
                <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />
        </analyzer>
</fieldtype>
<fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
                <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic" />
        </analyzer>
</fieldtype>

重启tomcat,访问分词器是否生效:

8.添加dataimport配置

导入相关jar文件,这里最好用最好用solr包自带的jar。这里的jar不是导入到tomcat中而是导入到solr_home中

(1)先在solr_server/solr_home/collection1中创建lib文件

(2)导入jar包 cp /usr/local/zip/solr-4.10.4/dist/solr-dataimporthandler-*  /opt/web_app/solr_server/solr_home/collection1/lib 中

(3)修改/opt/web_app/solr_server/solr_home/collection1/conf/solrconfig.xml文件

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
	<lst name="defaults">
		<str name="config">data-config.xml</str>
	</lst>
</requestHandler>

拷贝/usr/local/zip/solr-4.10.4/example/example-DIH/solr/db/conf/db-data-config.xml 文件并把名字修改成data-config.xml

(4)修改data-config.xml文件

<dataConfig>
        <dataSource type="JdbcDataSource" driver="Oracle.jdbc.driver.OracleDriver" 

url="jdbc:oracle:thin:@ip/RACDB" user="xxx" password="xxx" />
                <document>
                        <entity name="id" query="select * from cargo">
						<field column="ID" name="id"/>

			</entity>
	        </document>
</dataConfig>

重新启动tomcat测试dataimport功能是否能用

如图成功,单机solr配置完成

时间: 2024-10-11 15:40:44

solr4.10.4 单机安装(并添加dataimport和中文分词器)的相关文章

Solr4.10与tomcat整合并安装中文分词器

1.solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器.Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展,并对索引.搜索性能进行了优化. Solr可以从Solr官方网站(http://lucene.apache.org/solr/ )下载,解压后目录如下: bin:solr的运行脚本 contrib:solr的一些贡献软件/插件,用于增强solr的功能. dist:该目录包含build过程中产生的war和jar文

Windows下面安装和配置Solr 4.9(三)支持中文分词器

首先将下载解压后的solr-4.9.0的目录里面找到lucene-analyzers-smartcn-4.9.0.jar文件, 将它复制到solr的应用程序里面D:\apache-tomcat-7.0.54\webapps\solr\WEB-INF\lib, 备注:网上很多文章使用IK中文分词器(IK_Analyzer2012_u6.jar)但是在solr-4.9.0版本中,我是一直没有配置成功.所以只能使用solr自带的中文分词器了. 在回到solr的应用程序目录(D:\Demos\Solr\

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

为了更好的排版, 所以将IK分词器的安装重启了一篇博文,  大家可以接上solr的安装一同查看.[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例一: http://www.cnblogs.com/wang-meng/p/5814798.html 8, 打开浏览器查看solr可视化界面 到了这里solr就配置好了, 可是我们的IK 分词器还没有配置呢, 如果不配IK分词器的话 它是怎样分词的呢? 我们就来先看一下:  每个字都分成了一个词, 这当然不是我们想要的结果

solr4.5配置中文分词器mmseg4j

solr4.x虽然提供了分词器,但不太适合对中文的分词,给大家推荐一个中文分词器mmseg4j mmseg4j的下载地址:https://code.google.com/p/mmseg4j/ 通过以下几步就可以把mmseg4j分词器集成到solr中: 1.解压mmseg4j-1.9.1.zip,把dist下面的所有jar文件拷贝到你应用服务器下的solr/WEB-INF/lib中(如果你的应用服务器下面没有solr,请参考<solr部署到tomcat>). 2.拷贝data到solr_home

elasticsearch 安装中文分词器

发车 为什么要在elasticsearch中要使用ik这样的中文分词呢,那是因为es提供的分词是英文分词,对于中文的分词就做的非常不好了,因此我们需要一个中文分词器来用于搜索和使用.今天我们就尝试安装下IK分词. 上车 1.去github 下载对应的分词插件https://github.com/medcl/elasticsearch-analysis-ik/releases根据不同版本下载不同的分词插件 2.到es的plugins 目录创建文件夹cd your-es-root/plugins/

如何在Elasticsearch中安装中文分词器(IK)和拼音分词器?

声明:我使用的Elasticsearch的版本是5.4.0,安装分词器前请先安装maven 一:安装maven https://github.com/apache/maven 说明: 安装maven需要java1.7+ 编译安装分词器时,可能会报错,报错信息如下: [ERROR] COMPILATION ERROR : [INFO] -------------------------------------------------------------[ERROR] No compiler i

solr中文分词器IK-analyzer安装

solr本身对中文是不支持的,所以需要下载中文分词器IK-analyzer  下载地址https://code.google.com/archive/p/ik-analyzer/downloads.自己本地系统是centos6.7,所以下载了https://storage.googleapis.com/google-code-archive-downloads/v2/code.google.com/ik-analyzer/IK%20Analyzer%202012FF_hf1.zip 安装步骤:

Solr6.6.0添加IK中文分词器

IK分词器就是一款中国人开发的,扩展性很好的中文分词器,它支持扩展词库,可以自己定制分词项,这对中文分词无疑是友好的. jar包下载链接:http://pan.baidu.com/s/1o85I15o 密码:p82g下载好之后,将IK对应的jar复制到项目的D:\tomcat\webapps\solr\WEB-INF\lib下面,然后在WEB-INF下面创建一个classes的目录,将其余三个文件(IKAnalyzer.cfg.xml , ext.dic和stopword.dic)复制到这个cl

30.IK中文分词器的安装和简单使用

在之前我们学的都是英文,用的也是英文的standard分词器.从这一节开始,学习中文分词器.中国人基本上都是中文应用,很少是英文的,而standard分词器是没有办法对中文进行合理分词的,只是将每个中文字符一个一个的切割开来,比如说中国人 --> 中 国 人 在中方搜索引擎领域,比较成熟和流行的,就是ik分词器. 一.在elasticsearch中安装ik中文分词器 (1)git clone https://github.com/medcl/elasticsearch-analysis-ik (