solr需要的环境 :JDK、apache-tomcat、solr
本人所用的配置:papche-tomcat-7.0.68 和solr4.6.0
1、下载solr-4.6.0,
2、解压出solr-4.6.0,
3、复制solr-4.6.0\example\webapps中的solr.war文件到tomcat安装目录中的webapps文件夹下
4、运行tomcat。(忽略怎么运行tomcat),tomcat会自动解压solr.war文件。
5、删除solr.war文件。(不然每次启动tomcat都会发布一次)
6、回到tomcat的webapps目录下,记事本打开solr\WEB-INF\web.xml文件。加入如下代码:在<web-app />节点内的最后。
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>E:\solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
如上代码,需要在(C/D/E/F)任意盘新建一个文件夹:solrhome
7、回到解压的solr-4.6.0目录,打开文件夹:solr-4.6.0\example\solr,复制所有内容到E:\solrhome
8、打开文件夹:solr-4.6.0\example\lib\ext,复制所有jar包到tomcat的webapps\solr\WEB-INF\lib下。
9、运行web:http://localhost:8080/solr,将看到solr后台的界面
10、添加mmseg4j-1.9.1中文分词器
mmseg4j-1.9.1\dist 目录下 文件复制入 webapps\solr\WEB-INF\lib
同时 到\home\collection1\conf下找到schema.xml,加上如下代码:
<fieldType name="text_mmseg4j_complex" class="solr.TextField" positionIncrementGap="100" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="text_mmseg4j_maxword" class="solr.TextField" positionIncrementGap="100" >
<analyzer>
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic"/>
</analyzer>
</fieldType>
<fieldType name="text_mmseg4j_simple" class="solr.TextField" positionIncrementGap="100" >
<analyzer>
<!--
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/OpenSource/apache-solr-1.3.0/example/solr/my_dic"/>
-->
<tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic"/>
</analyzer>
</fieldType>
<!-- mmseg4j-->
11 进入http://localhost:8080/solr 搜索界面会报错,这就对了,恭喜你已经配置成功,本公司大神按照报错信息开发了一个新的文件替换原来的,就不展示了,网上有后续分词BUG解决办法