[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.

为了更好的排版, 所以将IK分词器的安装重启了一篇博文,  大家可以接上solr的安装一同查看.
[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例一: http://www.cnblogs.com/wang-meng/p/5814798.html

8, 打开浏览器查看solr可视化界面

到了这里solr就配置好了, 可是我们的IK 分词器还没有配置呢, 如果不配IK分词器的话 它是怎样分词的呢? 我们就来先看一下: 

每个字都分成了一个词, 这当然不是我们想要的结果, 接下来我们就开始配置IK 分词器.

9, 使用IK分词器
复制IK分词器的jar包到/tomcat/webapp/solr/WEB-INF/lib(这里是solr/WEB-INF下)

lk.cfg.xml 和stopword.dic 复制到tomcat/webapp/WEB-INF/classes下(默认没有classes目录, 需自己手动创建)

10, 配置IK分词器
配置solr家中的schema.xml文件, 包括配置数据类型及自定义的字段

编辑schema.xml, 由于这个文件有1000多行, 所以我们改用notepad++ 来打开(这个软件相信大家都不陌生)

找到schema.xml并打开修改: 

修改如下:

重启tomcat然后继续去solr可视化界面查看: 

再来看现在的分词是不是好多了呢? 当然有了IK分词器还是不够的, 往往我们还需要配置自己的扩展词和停词来满足我们的需求.

11, 配置扩展词和停词
首先看下配置文件:

使用vim编辑IKAnalyzer.cfg.xml:

添加ext.dic文件, 然后在ext.dic文件中添加扩展词:

同理, 添加停词可以在stopwork.dic直接添加.
到了这里IK分词器也配置好了. 哎, 从头来还是搞了一上午, 不过又重新操作一遍, 对这些又更加熟练了.

时间: 2024-10-13 16:06:24

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例二.的相关文章

[Linux]Linux下安装和配置solr/tomcat/IK分词器 详细实例一.

在这里一下讲解着三个的安装和配置, 是因为solr需要使用tomcat和IK分词器, 这里会通过图文教程的形式来详解它们的安装和使用.注: 本文属于原创文章, 如若转载,请注明出处, 谢谢.关于设置IK分词器的文章 IK分词器: http://www.cnblogs.com/wang-meng/p/5814798.html 1, 解压tar文件首先我们在根目录下建立一个solr目录(使用命令: mkdir /solr):  然后查看目录是否生成成功:  解压solr/tomcat/IK 到sol

[Linux] linux下安装配置 zookeeper/redis/solr/tomcat/IK分词器 详细实例.

今天 不知自己装的centos 出现了什么问题, 一直卡在 启动界面, 找了半天没找见原因(最后时刻还是发现原因, 只因自己手欠一怒之下将centos删除了, 而且选择的是在本地磁盘也删除. ..让我哭一会..)..于是便重新安装, 可是问题来了, 之前安装及配置好的zookeeper/redis/solr/tomcat/IK 等都需要重新安装, 于是便找了很多文档视频资料重新一个个安装和配置.. 哎,真是麻烦, 所以想记录在这一个博文中方便以后查阅....注明: 本文章属于原创,如若转载请注明

017在Linux系统下安装和配置Tomcat

实例说明 介绍在Linux系统下安装可配置Tomcat 设计过程 首先要把xxx.tar.gz上传到Linux,然后开始执行以下命令 使用tar -zxvf xxx.tar.gz解压文件,屏幕将显示解压信息 使用ll显示出Tomcat文件夹xxx 使用mv xxx  /usr/tomcatX 把文件夹移动到usr目录下 使用mv xxx tomcatX修改目录文件名为tomcatX 进入tomcatX/bin目录下,startup.sh和catalina.sh这两个文件能启动tomcat ./s

Linux CentOS下安装、配置mysql数据库

如果要在Linux上做j2ee开发,首先得搭建好j2ee的开发环境,包括了jdk.tomcat.eclipse的安装(这个在之前的一篇随笔中已经有详细讲解了Linux学习之CentOS(七)--CentOS下j2ee环境搭建),如果要开发web项目,我们当然可以安装一个myeclipse到Linux系统上去,这个安装方法和安装eclipse完全相同,就没有记录下来了,有了jdk.tomcat.eclipse我们就已经能进行我们的程序开发了,但是如果要做一个项目,哪怕是小的不能再小的项目都离不开数

使用Docker 安装Elasticsearch、Elasticsearch-head、IK分词器 和使用

原文:使用Docker 安装Elasticsearch.Elasticsearch-head.IK分词器 和使用 Elasticsearch的安装 一.elasticsearch的安装 1.镜像拉取 docker pull elasticsearch:tag 2.启动 docker run -it -e "discovery.type=single-node" --name="es" -p 9200:9200 -p 9300:9300 elasticsearch 3

Solr和IK分词器的整合

IK分词器相对于mmseg4J来说词典内容更加丰富,但是没有mmseg4J灵活,后者可以自定义自己的词语库.IK分词器的配置过程和mmseg4J一样简单,其过程如下: 1.引入IKAnalyzer.jar包到solr应用程序的WEB-INF/lib/目录下 2.打开solr的home/conf目录下的schema文件,在<types></types>内加入如下代码: <fieldType name="text_zh" class="solr.Te

在Linux环境下安装和配置phpmyadmin

phpmyadmin是一种mysql的图形化管理工具,该工具允许你在web界面上管理你的mysql数据库,不可谓不方便快捷. 此次安装与配置是在centos 6.4系统下,该系统已部署lnmp环境.关于phpmyadmin的安装,你可以选择yum的在线安装方式,也可以在其官方网站上下载,然后解压缩至你的web服务器目录下.为方便起见,这里选择的是第一种方法,如果有朋友想了解第二种方法的,欢迎留言. 安装phpmyadminyum -y install phpmyadmin //执行yum在线安装

linux -- Ubuntu下安装和配置Apache2

在Ubuntu中安装apache 安装指令:sudo apt-get install apache2 启动和停止apache的文件是:/etc/init.d/apache2 启动命令:sudo apache2ctl -k start (或 server apache2 start) 停止命令:sudo apache2ctl -k stop (或 server apache2 stop) 重新启动:sudo apache2ctl -k restart  (或 server apache2 rest

Solr(四)Solr实现简单的类似百度搜索高亮功能-1.配置Ik分词器

配置Ik分词器 一 效果图 二 实现此功能需要添加分词器,在这里使用比较主流的IK分词器. 1 没有配置IK分词器,用solr自带的text分词它会把一句话分成单个的字. 2 配置IK分词器,的话它会把句子分成词组 三 下载配置分词器 1 下载分词器IK 分词器下载地址: http://download.csdn.net/detail/u013292160/9926148 2 解压下载的文件 3 将ik-analyzer-solr5-5.x.jar这个jar包放入solr项目下的WEB-INF\