ElasticSearch安装拼音插件(pinyin)

环境介绍

集群环境如下:

  • Ubuntu14.04
  • ElasticSearch 2.3.1(3节点)
  • JDK1.8.0_60

开发环境:

  • Windows10
  • JDK 1.8.0_66
  • Maven 3.3.3
  • Intellij IDEA 2016.1

下载编译Pinyin

  • clone elasticsearch-analysis-pinyin

    通过IntelliJ从git上克隆elasticsearch-analysis-pinyin工程

  • 修改ES版本

    下载完项目后修改项目根目录下pom.xml文件中的properties/elasticsearch.version节点值为2.3.1,以确保编译后的版本兼容ES2.3.1版本;

  • 编译

    打开IntelliJ Terminal工具,输入以下命令:

    mvn clean install -Dmaven.test.skip

    可以在项目目录elasticsearch-analysis-pinyin\target\releases看到编译后的结果elasticsearch-analysis-pinyin-1.7.4.zip,以及elasticsearch-analysis-pinyin\target目录下的elasticsearch-analysis-pinyin-1.7.4.jar。

    这里我们主要使用zip包。

安装部署

  • 安装

    在ES服务器每个节点的${ES_HOME}/plugins目录下新建文件夹,名为pinyin;

    解压上述zip压缩包,可见三个文件elasticsearch-analysis-pinyin-1.7.4.jar、plugin-descriptor.properties、pinyin4j-2.5.0.jar,将其上传到ES服务器pinyin文件夹内即可;

  • 重启

    节点安装完pinyin插件后,需要重启生效。

  • 多节点集群

    ES集群每个节点都进行上述安装。

测试

分词测试

  • 建立测试索引

    建立一个测试分词效果的索引medcl,在节点终端执行如下代码:

  1. curl -XPUT http://localhost:9200/medcl/ -d‘
  2. {
  3. "index" : {
  4. "analysis" : {
  5. "analyzer" : {
  6. "pinyin_analyzer" : {
  7. "tokenizer" : "my_pinyin",
  8. "filter" : ["standard"]
  9. }
  10. },
  11. "tokenizer" : {
  12. "my_pinyin" : {
  13. "type" : "pinyin",
  14. "first_letter" : "none",
  15. "padding_char" : " "
  16. }
  17. }
  18. }
  19. }
  20. }‘
  • 通过浏览器测试分词
  1. http://10.110.13.144:9200/medcl/_analyze?text=%E5%88%98%E5%BE%B7%E5%8D%8E&analyzer=pinyin_analyzer

若测试成功,浏览器返回结果如下:

  1. {"tokens":[{"token":"liudehua","start_offset":0,"end_offset":3,"type":"word","position":0}]}

建立拼音索引

  • 建立索引并设置分词
  1. curl -XPOST http://localhost:9200/medcl/_close
  2. curl -XPUT http://localhost:9200/medcl/_settings -d‘
  3. {
  4. "index" : {
  5. "analysis" : {
  6. "analyzer" : {
  7. "pinyin_analyzer" : {
  8. "tokenizer" : "my_pinyin",
  9. "filter" : ["standard"],
  10. "type":"pinyin"
  11. }
  12. },
  13. "tokenizer" : {
  14. "my_pinyin" : {
  15. "type" : "pinyin",
  16. "first_letter" : "none",
  17. "padding_char" : " "
  18. }
  19. }
  20. }
  21. }
  22. }‘
  23. curl -XPOST http://localhost:9200/medcl/_open
  • 建立mapping
  1. curl -XPOST http://localhost:9200/medcl/folks/_mapping -d‘
  2. {
  3. "folks": {
  4. "properties": {
  5. "name": {
  6. "type": "multi_field",
  7. "fields": {
  8. "name": {
  9. "type": "string",
  10. "store": "no",
  11. "term_vector": "with_positions_offsets",
  12. "analyzer": "pinyin_analyzer",
  13. "boost": 10
  14. },
  15. "primitive": {
  16. "type": "string",
  17. "store": "yes",
  18. "analyzer": "keyword"
  19. }
  20. }
  21. }
  22. }
  23. }
  24. }‘
  • 上传数据
  1. curl -XPOST http://localhost:9200/medcl/folks/andy -d‘{"name":"刘德华"}‘
  • 在浏览器请求检索
  1. http://10.110.13.144:9200/medcl/folks/_search?q=name:liudehua

若检索成功,浏览器返回以下结果:

  1. {"took":9,"timed_out":false,"_shards":{"total":5,"successful":5,"failed":0},"hits":{"total":1,"max_score":3.0685282,"hits":[{"_index":"pinyin","_type":"test","_id":"andy","_score":3.0685282,"_source":{"name":"刘德华"}}]}}

参考资料

来自为知笔记(Wiz)

附件列表

时间: 2024-08-03 21:45:26

ElasticSearch安装拼音插件(pinyin)的相关文章

ElasticSearch搜索引擎安装配置拼音插件pinyin

一.pinyin插件安装 1.首先前往GitHub下载安装包(注意版本与ElasticSearch对应,若无对应版本,解压后修改pom.xml文件中的elasticsearch.version,建议查看修改一下版本号),上传至/home/目录,并解压至当前目录,如下图所示: 1 vim /home/elasticsearch-analysis-pinyin-6.3.2/pom.xml 2.然后切换至解压目录进行编译(若无安装Maven工具,首先安装Maven才能编译,具体参考Linux安装Mav

elasticsearch 安装及其插件

插件作为一种普遍使用的,用来增强原系统核心功能的机制,得到了广泛的使用,elasticsearch也不例外. 1. 安装Elasticsearch插件 从0.90.2安装其实很简单,有三种方式, 1.1 在确保你网络顺畅的情况下,执行如下格式的命令即可: 1 plugin --install <org>/<user/component>/<version> 具体的<org>/<user/component>/<version>可参加各

elasticsearch 安装 head插件

head插件 切换到Elasticsearch的安装目录 cd ~/demo/elasticsearch/es1 执行安装命令 [[email protected] es1]# bin/plugin install mobz/elasticsearch-head 打开http://10.10.10.201:9200/_plugin/head/ 安装成功 插件安装参考: Elasticsearch Plugins and Integrations:https://www.elastic.co/gu

elasticsearch安装, es插件安装, http接口调用

1,elasticsearch的安装 1,es启动时需要使用非root用户,所有创建一个bigdata用户(如果是root用户安装的话,启动时会有提示 elastic could not run a root的报错): #创建用户 useradd bigdata #为hadoop用户添加密码: echo 123456 | passwd --stdin bigdata #将bigdata添加到sudoers echo "bigdata ALL = (root) NOPASSWD:ALL"

elasticsearch安装head插件

Windows安装插件 方式一:打开cmd端口到D:\DevTools\elasticsearch-2.4.6\bin目录下,输入命令:plugin install mobz/elasticsearch-head注意:2.0以上版本install参数前不加-,成功后 plugins文件夹里就多了个head文件夹 方式二:从https://github.com/mobz/elasticsearch-head下载ZIP包.在elasticsearch目录下创建目录/plugins/head/_sit

elasticsearch安装中文插件ik

好久没写博文了,最近一直加班做项目,正在做搜索方面的工作,因此测试了一下es,经过无数次失败,终于成功安装了es+ik 从网上找了无数的安装方法都是一样,安装不成功 es 2.0安装 es官方网站下载es2,解压后即可执行,可暂时不配置,本人只修改了数据和日志的路径 下载ik https://github.com/medcl/elasticsearch-analysis-ik 安装maven java 本人都是通过apt-get默认安装的,配置CLASSPATH JAVA_HOME 解压ik,并

elasticsearch安装servicewrapper插件

1)下载elasticsearch-servicewrappergit clone https://github.com/elasticsearch/elasticsearch-servicewrapper然后将目录下的service目录拷贝至ES_HOME/bin目录下. 2)简单配置jvm的内存修改ES_HOME/bin/service/elasticsearch.conf,set.default.ES_HEAP_SIZE=1024,该值根据机器的配置可自定义. 3)安装启动服务执行命令:E

elasticsearch安装bigdest插件

bigdest下载地址:https://github.com/hlstudio/bigdesk 对于bigdest插件来说,安装是非常简单的. 只要三个步骤就可以了,下载--解压--进入到_side文件夹里启动服务 启动的命令:python -m SimpleHTTPServer 原文地址:https://www.cnblogs.com/yeyu1314/p/10224320.html

elasticsearch 安装hanlp插件

1.HanLP分词器插件下载地址https://github.com/pengcong90/elasticsearch-analysis-hanlp/releases下载analysis-hanlp.zip 2.解压到ElasticSearch下plugins目录下 3.配置修改analysis-hanlp目录下的hanlp.properties文件,修改root的属性,值为analysis-hanlp下的data 目录的地址修改analysis-hanlp目录下的plugin-descript