solr学习文档之添加分词词库

在上一篇文章中我们学习了solr的快速入门和针对mysql数据库建立索引，今天我们介绍如何为solr添加中文分词

1、在百度搜索ik-analyzer，找到后下载，我下载的是【IKAnalyzer 2012FF_hf1.zip】，解压后会看到如下目录

2、把IKAnalyzer2012FF_u1.jar拷贝到webapps下solr的lib文件夹下，把IKAnalyzer.cfg.xml和stopword.dic拷贝到solr的conf目录中

3、修改schema.xml文件，增加如下内容：

<fieldTypename="text_ik" class="solr.TextField">
     <analyzerclass="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

4、重启tomcat，在collection1中找到analysis，

选择text_ik并输入汉字“你好”，将会看到

则表示成功，你也可以按照ik所给的pdf文档进行操作

所谓分词，就是把你的话给拆开，比如，“我是一个好人”，不同的分词粒度拆分的细度不一样，有的拆成“我，我是，一，一个，好，好人，人”，有的拆成“我是，一个，好人”这主要取决于你的分析粒度

时间： 2024-10-14 00:26:58

solr学习文档之添加分词词库的相关文章

solr学习文档之高亮

在<solr学习文档之添加分词词库>一文中,我们学习了如何对一个词组进行分词提取,这一章我们将会使用到分词词库,并介绍如何进行高亮展现在此之前,我们先了解一下高亮的几个参数 hl:是否开启高亮组件,true为开启,false为不开启 hl.fl:需要开启的高亮字段,多个可用逗号隔开 hl.simple.pre:高亮字段前缀 hl.simple.post:高亮字段后缀 (其他的暂不介绍,想知道的可自行百度) 想要进行高亮站下,需要在schema.xml中将你的字段名(如topicContent

solr学习文档之增量更新索引

之前已经介绍过如何使用solr和mysql建立索引,但索引一旦建立,之后新增的数据便不能插入了,除非每次新增数据都重新建立一遍索引,但这样太过耗时费力,故而,本章将介绍如何增量更新索引 1. 找到之前data-config.xml文件,打开并在query后面加入 deltaQuery="select TOPIC_ID,TOPIC_CONTENT from t_topicwhere TOPIC_ADD_DATE > '${dataimporter.last_index_time}'&quo

2013 最新的 play web framework 版本 1.2.3 框架学习文档整理

Play framework框架学习文档 Play framework框架学习文档 1 一.什么是Playframework 3 二.playframework框架的优点 4 三.Play FrameWork开发入门 5 1.准备工作 5 2.新建项目 5 3.环境变量配置 7 4.MVC模型 8 app/controllers 9 app/models 9 app/views 9 5.应用程序布局 9 app目录 9 .class文件在哪儿? 9 public目录 10 conf目录 10 l

Windows Workflow学习文档

Windows Workflow学习文档 1 概念 2 Windows Workflow 2.1 .Net Framework 3.0 简介 2.2 Windows Workflow Foundation简介 3 开发环境搭建 4 Workflow模型 4.1 WF中流程模型 4.2 关键概念 5 Activity 5.1 什么是Activity 5.2 Activity的其他概念 5.3

Solr Wiki文档

相比ElasticSearch,Solr的文档详尽丰富,同时也显得冗余啰嗦. Solr的官方文档有两个地方: Solr官方教程 Solr社区维基本文主要列出一些Solr Wiki中的主要讨论主题,方便查阅: SolrJ 主要讲解Solr Java客户端的使用方法,版本比较老. SolrSchema.xml 主要讲解SolrSchema.xml相关配置. Solr中文分词 Solr自带多语言分词工具,主要是CJKTokenizer和SmartChineseTokenizer,基本上跟Lucene

PDF文档如何添加链接

PDF文档怎么添加链接?这是不少小伙伴日常工作和学习遇到的一个问题,今天小编就分享一下PDF文档添加链接的教程. 1. 首先用福昕阅读器打开PDF文件. 2. 点击顶部导航栏"主页"-"链接" 3. 在正文处选中需要插入链接的部位,拖动并滑动鼠标,轻轻勾勒出需要插入链接的范围,然后松开鼠标. 4. 在弹出的选项框中选择要插入的链接类型.如果要插入网络链接就勾选"打开web链接".如果要跳转到其他视图就勾选"跳转到页面视图" 5

Mybatis学习文档

Mybatis学习文档 Mybatis是持久层框架类似于Hibernate的orm持久层框架 1.JDBC访问数据库存在的问题频繁创建和打开.关闭数据链接,太消耗资源 Sql语句存在硬编码,不利于维护 Sql参数设置硬编码,不利于维护结果集获取与遍历复杂,存在硬编码,不利于维护,期望查询后返回一个java对象 2.Mybatis介绍前身是apache下的开源项目,2010有aspache software foundation 迁移到了google code ,并且改名为Mybatis,2

mfc学习---文档视图架构

MFC的AppWizard可以生成三种类型的应用程序:基于对话框的应用.单文档应用(SDI)和多文档应用(MDI). 一般情况下,采用文档/视结构的应用程序至少应由以下对象组成: 1.应用程序是一个CwinApp派生对象,它充当全部应用程序的容器.应用程序沿消息映射网络分配消息给它的所有子程序. 2.框架窗口是一CfrmeWnd派生对象. 3.文档是一个CDocument派生对象,它存储应用程序的数据,并把这些信息提供给应用程序的其余部分. 4.视

NodeJS-001-Nodejs学习文档整理(转-出自http://www.cnblogs.com/xucheng)

Nodejs学习文档整理 http://www.cnblogs.com/xucheng/p/3988835.html 1.nodejs是什么: nodejs是一个是javascript能在后台运行的平台,具体来时只是使code javascript能在后台运行,因为不在浏览器中运行所以不涉及到document等对象.(Mozilla 则指出 JavaScript 由Core JavaScript 和 Client JavaScript 组成.) 2.nodejs如何运行javascript: n