solr4.5.1与IKAnalyzer2012FF_u1整合

1.将 E:\jar\solr-4.1.0\solr-4.1.0\example\webapps 下的 solr.war 拷贝到 tomcat下

运行  tomcat ,此时控制台里面会有报错提示,是找不到solr的实例运行环境。这时关闭tomcat。

2.删除webapps目录下面的solr.war包。将下载的solr目录下面的example下面的solr目录复制到tomcat的webapps/solr下面。下面的目录结构大概是这样的webapps/solr/solr/collection1类似这样的。(当然这里也可以在稍后的配置文件只去指定固定的位置,配置所以位置)

3.打开webapps/solr/WEB-INF/web.xml文件,在里面添加如下内容。env-entry-value这个目录是指向上一个步骤中的目录。这里使用的是相对目录(相对于tomcat的bin目录),也可以使用绝对路径,如d:/solr等。步骤2中的目录不一定要位于tomcat中,只要此步骤中将路径配置正确即可。

Java代码  

  1. <env-entry>
  2. <env-entry-name>solr/home</env-entry-name>
  3. <env-entry-value>../webapps/solr/solr</env-entry-value>
  4. <env-entry-type>java.lang.String</env-entry-type>
  5. </env-entry>

再次运行tomcat,输入http://localhost:8080/solr即可访问在tomcat中运行的solr环境

整体配置完成,这次solr 的UI 还是很不错,还有相关监控服务器状态

接下来导入数据索引

在链接数据库之前 需要配置数据库

创建一个 数据源 配置文件 data-config.xml

创建的位置在

d:\tomcat\webapps\solr\solr\collection1

当然 如果你的指向 不是放在tomcat下 就在相应的solr下的conf下创建 (注意在lib目录下添加mysql驱动mysql-connector-java-5.1.21.jar)

Xml代码  

  1. <dataConfig>
  2. <dataSource type="JdbcDataSource" driver="oracle.jdbc.driver.OracleDriver"
  3. url="jdbc:oracle:thin:@ip:1521:db01" user="root" password="root" />
  4. <document>
  5. <entity name="id" query="select ID,USER_NAME,USER_PASS,USER_TYPE,USER_ROLE from T_USER">
  6. <field column="ID" name="id"/>
  7. <field column="USER_NAME" name="username"/>
  8. <field column="USER_PASS" name="userpass"/>
  9. <field column="USER_TYPE" name="usertype"/>
  10. <field column="USER_ROLE" name="userrole"/>
  11. </entity>
  12. </document>
  13. </dataConfig>

在 solrconfig.xml 添加 数据源配置

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
<span style="white-space:pre">	</span><lst name="defaults">
<span style="white-space:pre">		</span><str name="config">data-config.xml</str>
<span style="white-space:pre">	</span></lst>
</requestHandle>

打开 schema.xml

添加索引对应  这里的type=‘my_text‘ 是我自定义的IK分词库

<field name="username" type="my_text" indexed="true" stored="true" />
   <field name="userpass" type="my_text" indexed="true" stored="true" />
   <field name="usertype" type="my_text" indexed="true" stored="true" />
   <field name="userrole" type="my_text" indexed="true" stored="true"/>
</field>

打开浏览器就可以看到下面界面:

执行导入。

如果数据量不大 刷新下状态会显示是否成功。

成功是绿色信息,失败嘛 当然 红色。

下面是关于添加IK分词库的配置

下载最新的IK分词,因为solr4以后 之前的IK无法支持,所以需要下载新的 名为

IK Analyzer 2012FF_hf1 以后可能会更新 大家去官网查看下就好了

记得看好相应的版本号。

将 IKAnalyzer2012FF_u1.jar  拷贝到lib 下,将IKAnalyzer.cfg.xml
stopword.dic拷贝到classes下。

在 之前的 schema.xml中 找到 <types></types>

加入 IK 分词库的配置

                 <fieldType name="text_ik" class="solr.TextField">
                      <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
                      <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
                  </fieldType>
                  
时间: 2024-08-05 12:49:20

solr4.5.1与IKAnalyzer2012FF_u1整合的相关文章

Solr4.8.1与Tomcat7整合

Solr4.8.1和Tomcat7都可以到官方网站去下载,我这里就不多说了,如下图. 这里我们首先解压Solr-4.8.1.zip,再解压Tomcat,解压后,再在当前文件夹下建2个文件夹,一个用来放Solr的目录文件的,一个用来放Tomcat要跑起来的solr项目,如下图: 将\solr-4.8.1\example\solr下的文件拷贝到home文件夹下,将\solr-4.8.1\example\webapps下的solr.war拷贝到server目录下并解压并删除war包,如下图: 我们在h

Solr-4.10.2与Tomcat整合

1.将下载的solr解压至D:\solr,拷贝d:\solr\solr-4.10.2\example\webapps\solr.war到Tomcat的webapps\目录中.直接解压 solr.war 或者启动Tomcat 解压 solr.war2.新建 D:\solr\data目录,拷贝d:\solr\solr-4.10.2\example\solr文件夹到 D:\solr\data3.修改 D:\solr\data\solr\collection1\conf\solrconfig.xml  

solr在tomcat下安装、配置

solr简介 solr是受欢迎的,速度极快的开源企业搜索平台.主要功能包括强大的全文搜索,搜索词高亮显示,分面搜索,近实时的索引,动态聚类,数据库集成,丰富的文件(例如,Word,PDF)处理,和空间搜索.Solr是高度可靠的,可扩展性和容错性,提供了分布式的索引,复制和负载均衡的查询,自动故障转移和恢复,集中配置和更多.许多世界上最大的互联网网站的导航.搜索功能都是采用solr实现的. solr是一个基于Lucene.采用JAVA语言编写.运行于servlet容器中(如jetty,tomcat

Solr导入数据库数据

接Solr-4.10.2与Tomcat整合.1.在solrconfig.xml中添加数据导入节点,solrconfig.xml路径为D:\solr\data\solr\collection1\conf\solrconfig.xml.    <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">        <l

Solr中schema.xml的解释

接Solr-4.10.2与Tomcat整合.schema.xml位于D:\solr\data\solr\collection1\conf\中.1.fieldType节点    name: FieldType的名称    class: 指向org.apache.solr.analysis包里面对应的class名称,用来定义这个类型的行为    omitNorms: 字段检索时被省略相关的规范    positionIncrementGap:定义在同一个文档中此类型数据的空白间隔,避免短语匹配错误 

Solr4.10与tomcat整合并安装中文分词器

1.solr Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器.Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置.可扩展,并对索引.搜索性能进行了优化. Solr可以从Solr官方网站(http://lucene.apache.org/solr/ )下载,解压后目录如下: bin:solr的运行脚本 contrib:solr的一些贡献软件/插件,用于增强solr的功能. dist:该目录包含build过程中产生的war和jar文

Win7下Solr4.10.1和MySql的整合(索引与搜索)

1.打开D:\webserver\solr\collection1\conf\solrconfig.xml文件,在<requestHandler name="/select" class="solr.SearchHandler">行上面加入以下内容: <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImpo

IK分词器 整合solr4.7 含同义词、切分词、停止词

IK分词器如果配置成 <fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" is

全文检索引擎Solr系列——整合中文分词组件IKAnalyzer

IK Analyzer是一款结合了词典和文法分析算法的中文分词组件,基于字符串匹配,支持用户词典扩展定义,支持细粒度和智能切分,比如: 张三说的确实在理 智能分词的结果是: 张三 | 说的 | 确实 | 在理 最细粒度分词结果: 张三 | 三 | 说的 | 的确 | 的 | 确实 | 实在 | 在理 整合IK Analyzer比mmseg4j要简单很多,下载解压缩IKAnalyzer2012FF_u1.jar放到目录:E:\solr-4.8.0\example\solr-webapp\webap