分词技术是搜索技术里面的一块基石。很多人用过,如果你只是为了简单快速地搭一个搜索引擎,你确实不用了解太深。但一旦涉及效果问题,分词器上就可以做很多文章。例如, 在我们实际用作电商领域的搜索的工作中,类目预判的实现就极须依赖分词,至少需要做到可以对分词器动态加规则。再一个简单的例子,如果你的优化方法就是对不同的词分权重,提高一些重点词的权重的话,你就需要依赖并理解分词器。
下面将介绍如何在solr中为core:simple的title添加分词,承接上一篇博文(http://simplelife.blog.51cto.com/9954761/1864073 ),
启动tomcat,浏览器中访问:localhost:8080/solr
如图,点击collection1中的Analysis,在Field Value (Index)中输入:我爱北京天安门,并选择Analyse Fieldname / FieldType为:title
我们知道,我是没有对默认的core:collection1的title做分词的,所以当我输入一句话时并不会被分词。
下面我就为自定义这个core:simple的标题做分词,看看做完分词之后搜索的效果是什么……敬请期待!
========================================================================================
1、下载ik分词器的jar包:http://pan.baidu.com/s/1eScBIJC
2、将下载下来的jar包复制到apache-tomcat-7.0.72\webapps\solr\WEB-INF\lib中
3、在solrhome\simple\conf下的schema.xml文件中添加fieldType:
<fieldType name="text_ik" class="solr.TextField"> <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
然后将field中name="title"的type修改成text_ik,如下图:
4、重启tomcat,浏览器中访问:localhost:8080/solr, 选择simple-->Analysis,重新上面的操作看效果:
如果做到这,那么恭喜你,完成了solr中ik分词器的使用。