elasticsearch分词插件的安装

IK简介

IK Analyzer是一个开源的，基于java语言开发的轻量级的中文分词工具包。从2006年12月推出1.0版开始， IKAnalyzer已经推出了4个大版本。最初，它是以开源项目Luence为应用主体的，结合词典分词和文法分析算法的中文分词组件。从3.0版本开始，IK发展为面向Java的公用分词组件，独立于Lucene项目，同时提供了对Lucene的默认优化实现。在2012版本中，IK实现了简单的分词歧义排除算法，标志着IK分词器从单纯的词典分词向模拟语义分词衍化。

二、安装IK分词插件

1、获取分词的依赖包

通过git clone https://github.com/medcl/elasticsearch-analysis-ik，下载分词器源码，然后进入下载目录（elasticsearch-analysis-ik-1.2.6），执行命令：mvn clean package，执行命令之前需要先安装marven,打包生成elasticsearch-analysis-ik-1.2.6.jar。将这个jar拷贝到ES_HOME/plugins/analysis-ik目录下面，如果没有该目录，则先创建该目录。

2、ik目录拷贝

将下载目录中的ik目录拷贝到ES_HOME/config目录下面。

3、分词器配置

打开ES_HOME/config/elasticsearch.yml文件，在文件最后加入如下内容：

index:
  analysis:                   
    analyzer:      
      ik:
          alias: [ik_analyzer]
          type: org.elasticsearch.index.analysis.IkAnalyzerProvider
      ik_max_word:
          type: ik
          use_smart: false
      ik_smart:
          type: ik
          use_smart: true
index.analysis.analyzer.default.type: ik

ok！插件安装已经完成，请重新启动ES，接下来测试ik分词效果啦！

时间： 2024-11-08 21:57:26

elasticsearch分词插件的安装的相关文章

Elasticsearch 中文分词插件 jcseg 安装（Ubuntu 14.04 下）

搜索可以说是开发中很常见的场景了,同样这次也一样... 之前的组合多数是选择 Mysql + Sphinx ,这次因为工作原因不再使用这种组合,虽然是老牌组合,但是确实限制诸多,而且每次配环境也是个问题,挺烦的...这次就尝试使用 Elasticsearch + Jcseg ,因为在文档检索方面 elasticsearch 做的相当不错,但是对中文环境来说就差一个很好的中文分词器,还好,国内好的中文分词器也有蛮多,但是我个人还是比较推荐 Jcseg . 好了,废话不多扯. 版本说明: elast

Elasticsearch报警插件Watch安装以及使用

参考:http://blog.csdn.net/ptmozhu/article/details/52296958 http://corejava2008.iteye.com/blog/2214279 一.watcher 插件安装1.在ES_HOME目录下安装License插件: bin/plugin install license2.安装watcher插件 bin/plugin install watcher3.重新启动Elasticsearch bin/elasticsearch4.验证是否安

Elasticsearch安装中文分词插件ik

Elasticsearch默认提供的分词器,会把每个汉字分开,而不是我们想要的根据关键词来分词.例如: curl -XPOST "http://localhost:9200/userinfo/_analyze?analyzer=standard&pretty=true&text=我是中国人" 我们会得到这样的结果: { tokens: [ { token: text start_offset: 2 end_offset: 6 type: <ALPHANUM>

ElasticSearch安装ik分词插件

一.IK简介 IK Analyzer是一个开源的,基于java语言开发的轻量级的中文分词工具包.最初,它是以开源项目Luence为应用主体的,结合词典分词和文法分析算法的中文分词组件.从3.0版本开始,IK发展为面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现.在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化. 二.安装IK分词插件 1.获取分词的依赖包通过git clone https://g

Elasticsearch入门教程(一)：Elasticsearch及插件安装

原文:Elasticsearch入门教程(一):Elasticsearch及插件安装版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/vbirdbest/article/details/79194244 分享一个朋友的人工智能教程(请以"右键"->"在新标签页中打开连接"的方式访问).比较通俗易懂,风趣幽默,感兴趣的朋友可以去看看. 一:安装Elasti

ELK 学习笔记之 elasticsearch head插件安装

elasticsearch head插件安装: 准备工作: 安装nodejs和npm https://nodejs.org/en/download/ node-v6.11.2-linux-x64.tar.xz 由于是xz压缩文件,所以要先安装 yum -y install xz $xz -d ***.tar.xz $tar -xvf ***.tar 配置环境变量 # set node environment export NODE_HOME=/usr/local/node-v6.11.2-li

ElasticSearch 5.2.2 安装及 head 插件的安装

ElasticSearch 是一个基于 Lucene 的高度可扩展的开源全文搜索和分析引擎.它能够做到可以快速.实时地存储.搜索和分析大量数据.它通常作为底层引擎/技术,为具有复杂搜索功能和要求的应用程序提供支持. 笔者在大学期间试着搭建过 ES 集群,当时也仅限于尝试着搭建玩玩.现在开始,想要去系统地学习和使用它.废话不多说,开始直接上手搭建工作. 首先,需要下载 ElasticSearch 安装包.我在系统中已经搭建好的是 ES 5.2.2 版本的,下载链接:https://www.elas

ElasticSearch自定义分析器-集成结巴分词插件

关于结巴分词 ElasticSearch 插件: https://github.com/huaban/elasticsearch-analysis-jieba 该插件由huaban开发.支持Elastic Search 版本<=2.3.5. 结巴分词分析器结巴分词插件提供3个分析器:jieba_index.jieba_search和jieba_other. jieba_index: 用于索引分词,分词粒度较细: jieba_search: 用于查询分词,分词粒度较粗: jieba_other:

在ElasticSearch中使用 IK 中文分词插件

我这里集成好了一个自带IK的版本,下载即用, https://github.com/xlb378917466/elasticsearch5.2.include_IK 添加了IK插件意味着你可以使用ik_smart(最粗粒度的拆分)和ik_max_word(最细粒度的拆分)两种analyzer. 你也可以从下面这个地址获取最新的IK源码,自己集成, https://github.com/medcl/elasticsearch-analysis-ik, 里面还提供了使用说明,可以很快上手. 一般使用

猜你喜欢

算力的定义及评价

算力:企业所有可调用计算资源的总和,涵盖软硬件,本地及远程资源. 硬件包括PC,工作站和服务器等物理计算设备,智能仪器(比如示波器),以及其配套附件.软件包括操作系统(Windows系列,Linux等 ...

P1583 魔法照片

P1583 魔法照片题目描述一共有n(n≤20000)个人(以1--n编号)向佳佳要照片,而佳佳只能把照片给其中的k个人.佳佳按照与他们的关系好坏的程度给每个人赋予了一个初始权值W[i].然后将初 ...

UpnP Hacking

1.概述通用即插即用(UpnP)是一种用于PC机和智能设备的常见对等网络连接的体系结构. UPnP以Internet标准和技术(例如Tcp/IP.HTTP和XML)为基础,使这样的设备彼此可自动连接 ...

NodeJS模块系统

为了让NodeJS的文件可以相互调用,NodeJS提供了一个简单的模块系统. 模块是NodeJS应用程序的基本组成部分,文件和模块是一一对应的,换言之,一个NodeJS文件就是一个模块,这个文件可能是 ...

《需求分析和系统设计》读书笔记二

我阅读本书的第四章是需求规格说明,它阐明了体系结构在系统开发中的至关重要性,展现了UML的各个方面.书中还介绍了PCBMER体系结构.PCBMER表示-控制器-bean-中介者-实体-资源体系结构框架 ...

Q promise API简单翻译

详细API:https://github.com/kriskowal/q/wiki/API-Reference Q提供了promise的一种实现方式,现在在node中用的已经比较多了.因为没有中文的a ...

DeepID人脸识别算法之三代

DeepID人脸识别算法之三代转载请注明:http://blog.csdn.net/stdcoutzyx/article/details/42091205 DeepID,目前最强人脸识别算法,已经三 ...

linux系统下安装Python环境

如何在Linux系统下搭建Python开发环境(http://www.maiziedu.com/course/python/)?Python在Linux系统中安装方法在Windows下是有很大的区别的 ...

PHP AJAXFORM提交图片上传并显示图片源码

PHP dofile.php 文件上传源码 <?php $file_upload = "upload/"; $file_allow_ext='gif|jpg|jpeg|png ...

[leetcode]算法题目 - Sudoku Solver

最近,新加坡总理李显龙也写了一份代码公布出来,大致瞧了一眼,竟然是解数独题的代码!前几天刚刚写过,数独主要算法当然是使用回溯法.回溯法当时初学的时候在思路上比较拧,不容易写对.写了几个回溯法的算法之后 ...

poj 2038 Team Rankings 枚举排列

//poj 2038 //sep9 #include <iostream> #include <algorithm> using namespace std; char s[1 ...

Wiwiz虚拟机安装遇到"ErrorCode:4"及解决方法

Wiwiz虚拟机安装遇到"ErrorCode:4"及解决方法不久以前,我用无线路由器刷DD-WRT + Wiwiz做了几个收费Wifi热点,并赚了些钱,感觉挺不错. 现在需要帮朋 ...

PHP怎么实现网站保存快捷方式

PHP怎么实现网站保存快捷方式 <?php $Shortcut = "[InternetShortcut] URL=http://blog.csdn.net/phpfenghuo/ I ...

scrollview嵌套上下拉控件嵌套recyclerview

相信会碰到很多类似的需求,一个列表控件,然后控件上方的一个头部需要自定义,这样就不好有时候也不能加在列表控件的头部了,那必须得嵌套一层scrollview了,没毛病,那么一般的列表控件都是有上拉下拉的 ...

pk10冠亚军精准计划

pk10的单双.大小玩法可能已经无法满足玩家,比较热门的玩法猜pk10冠亚季军和精准前三玩法,两种都是前三的玩法,两种前三玩法又有哪些不同呢?猜前三的玩法类似于广大彩民朋友熟悉的十一运夺金前三直选玩法 ...

Understanding glibc malloc【待译】

今天尝试用Valgrind调试程序时,发现堆和栈的一些问题没有理解透彻,于是Google了下"Memory Layout C",接着就通过Memory Layout of C Pr ...

页面之间传递参数

打开一个浏览器窗口的方式: 1.<a href="" target="_blank"></a> 2.window.open() ---- ...

进行尽量少的乘法计算求出Sum = 1 + x + x^2 + x^3 + ..... + x^n

有点逆向思维的味道... 感觉需要灵光一现.. 所以我这边不提示了 -.- 代码在下面 #include <iostream> using namespace std; typede ...

ManualResetEvent的使用与介绍

它可以通知一个或多个正在等待的线程已发生事件,允许线程通过发信号互相通信,来控制线程是否可心访问资源当一个线程开始一个活动(此活动必须完成后,其他线程才能开始)时,它调用 Reset 以将 Manu ...

【poj3693-重复次数最多的连续重复子串】后缀数组

题意:给定一个串,长度<=10^5,求它重复次数最多的连续重复子串(输出字典序最小的那个). 例如ccabcabc,答案就是abcabc 一开始没想清楚,结果调了好久. 对于当前的L,i,i+1 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.020 s.