solr的同义词实现

solr同义词的具体实现

1.修改分词器的jar包并重新打包

　　在org.wltea.analyzer.lucene包下新增IKTokenizerFactory 类

package org.wltea.analyzer.lucene;

import java.io.Reader;
import java.util.Map;

import org.apache.lucene.analysis.Tokenizer;
import org.apache.lucene.analysis.util.TokenizerFactory;
import org.apache.lucene.util.AttributeFactory;

public class IKTokenizerFactory extends TokenizerFactory {
private final boolean useSmart;

public IKTokenizerFactory(Map<String, String> args) {
　　super(args);
　　this.useSmart = getBoolean(args, "useSmart", false);

}

@Override
public Tokenizer create(AttributeFactory factory, Reader in) {
　　return new IKTokenizer(in, this.useSmart);
　　}

}

2.修改配置文件schema.xml

不需要同义词的配置

<fieldType name="text_ik" class="solr.TextField" >
　　<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

修改为同义词的配置

修改synonyms.txt文件加入需要的同义词

如果同义词不生效,则需要下面的配置

在tomcat下的solr项目

IKAnalyzer.cfg.xml的配置

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
　　<comment>IK Analyzer 扩展配置</comment>
　　
　　<entry key="ext_dict">ext.dic;</entry>
　　<!--用户可以在这里配置自己的扩展停止词字典
　　<entry key="ext_stopwords">stopword.dic;</entry>

　　 -->
</properties>

有些特殊的词语我们在使用的过程中不需要进行分词所以需要配置停词

停词配置文件ext.dic的配置不分词的词语

最后的运行效果如下:

时间： 2024-12-29 11:33:01

solr的同义词实现

solr的同义词实现的相关文章

说一说solr在tomcat,jetty上的运行和安装优缺点

全文搜索技术——Solr

JAVAEE——Solr：安装及配置、后台管理索引库、使用SolrJ管理索引库、仿京东的电商搜索案例实现

Solr索引配置

IK分词器整合solr4.7 含同义词、切分词、停止词

solr schema.xml配置

Solr vs. Elasticsearch谁是开源搜索引擎王者

solr schema 配置详解

solr 简单搭建数据库数据同步（待续）