solr索引服务器的配置和solrj集成开发总结

一.环境:solr6.2 + jdk1.8 + tomcat8   (solr不同版本需要最低的环境不同) solr6 需要至少jdk1.8   。对应的solr5+jdk1.7+tomcat7 实测可用。

二.jdk的安装和环境变量设置(自行百度) ,tomcat安装解压版 安装版都可以。

三.solr集成tomcat服务器:

需要的安装文件。solr-6.2.0(solr文件)    sogou-dic-utf8(搜狗词库)  mmseg4j-solr-2.3.0.jar   mmseg4j-core-1.10.0.jar

只讲tomcat下的配置,solr6 本身集成 jetty 可以直接部署访问。

1.将solr-6.2.0\server\solr-webapp 下的 webapp复制到tomcat中,并改名为solr (solr5起项目都在这个地方)。

2.加入jar包和log4j 。   solr-6.2.0\server\lib\ext 下所有包到WEB-INF的lib下。\solr-6.2.0\server\resources  下的log4j.properties 到WEB-INF的classes目录下。没有则创建。

3.添加配置:   tomcat中apache-tomcat-7.0.70\webapps\solr 下创建solr_home为配置目录。将\solr-6.2.0\server\solr 下的 zoo.cfg  和  solr.xml  拷贝到solr_home中, 并solr_home下新建core为默认core 。选择configsets下一种配置方式拷贝里面的conf 到core中。并创建有一个core.properties   内容为 name=core 为创建的core文件夹名称。

4.dic为词库文件夹

5.启动tomcat 访问127.0.0.1:8080/solr/index.html  可以访问  但是分词中文时不能按正常语句分词。

6.集成mmseg分词器和搜狗词库。

7.导包:mmseg4j-solr-2.3.0.jar   mmseg4j-core-1.10.0.jar  创建词库dic目录  拷贝文件。

8.在  core/conf下managed-schema 中添加

<!-- mmseg4j--> <fieldType name="text_mmseg4j_complex" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic文件夹目录"/> </analyzer> </fieldType> <fieldType name="text_mmseg4j_maxword" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" dicPath="dic文件夹目录"/> </analyzer> </fieldType> <fieldType name="text_mmseg4j_simple" class="solr.TextField" positionIncrementGap="100" > <analyzer> <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="dic文件夹目录"/> </analyzer> </fieldType> <!-- mmseg4j-->

<!-- mmseg4j --> <field name="mmseg4j_complex_name" type="text_mmseg4j_complex" indexed="true" stored="true"/> <field name="mmseg4j_maxword_name" type="text_mmseg4j_maxword" indexed="true" stored="true"/> <field name="mmseg4j_simple_name" type="text_mmseg4j_simple" indexed="true" stored="true"/> <!--mmseg4j -->

分词器配置完成   可以实现中文分词

时间: 2024-10-25 19:48:11

solr索引服务器的配置和solrj集成开发总结的相关文章

JAVAEE——Solr:安装及配置、后台管理索引库、 使用SolrJ管理索引库、仿京东的电商搜索案例实现

1 学习回顾 1. Lucene  是Apache开源的全文检索的工具包 创建索引 查询索引 2. 遇到问题? 文件名 及文件内容  顺序扫描法  全文检索 3. 什么是全文检索? 这种先创建索引 再对索引进行搜索的过程叫全文检索 4. 索引是什么? 非结构数据中提取一个数据.并重新组合的过程叫索引 5. Lucene实现 6. 入门程序 磁盘文件为原始文件 创建索引 第一步:获取文件 第二步:创建文档对象 第三步:创建分析器 第四步:保存索引及文档到索引库 搜索索引 第一步:用户接口(百度)

使用solrj操作solr索引库

(solrj)初次使用solr的开发人员总是很郁闷,不知道如何去操作solr索引库,以为只能用<五分钟solr4.5教程(搭建.运行)>中讲到的用xml文件的形式提交数据到索引库,其实没有那么麻烦,solr配套有好多的客户端用于操作索引库,下面我们来讲如何用solrj去操作solr索引库. 一.认识solrj solrj是solr的java客户端,用于访问solr索引库.它提供了添加.删除.查询.优化等功能. 二.下载 百度.google以下solrj下载,你会发现根本就没有,那么我们该到哪儿

使用Solr索引MySQL数据

环境搭建 1.到apache下载solr,地址:http://mirrors.hust.edu.cn/apache/lucene/solr/ 2.解压到某个目录 3.cd into D:\Solr\solr-4.10.3\example 4.Execute the server by “java -jar startup.jar”Solr会自动运行在自带的Jetty上 5.访问http://localhost:8983/solr/#/ 创建MySQL数据 DataBase Name: mybat

Solr使用初探——Solr的安装环境与配置

Solr是一个apache名下很好用的开源索引.搜索工具,网上的资料虽多但很杂,笔者花了一天的时间对Solr进行了较为初步的研究,对Solr的基础应用做了一定的总结.文中涉及到的配置方法并不唯一,API的用法也未必规范,仅希望能够通过此文让大家对solr更快的入手. 一.Solr的安装环境与配置: 1.  下载所需软件,安装配置Tomcat 首先下载Tomcat与Solr,Tomcat可在各软件网站下载得到,Solr下载地址如下: http://mirror.bjtu.edu.cn/apache

solr与.net系列课程(一)solr的安装与配置

不久之前开发了一个项目,需要用到solr,因为所以在开始再网上查找资料,但是发现大部分的资料都是很片面的,要么就是只讲解solr如何安装的,要么就是只讲解solr的某一个部分的,而且很多都是资料都是一模一样的,一个人转载另一个人的,很难找到一个从solr配置,到与数据库连接在结合实际项目的,而且由于solr使用java开发的,所以现实中大多数的实例都是java版本的,.net版本的少之又少,所以一个.net开发人员在没有别人讲解的情况下学习solr是一件很吃力的事情,所以我想写出一个solr的系

全文索引----创建多表solr索引

我们在使用solr作为索引服务器时,通常会将多个表的多个字段作为联合索引,对多个表快速的数据查询也是solr服务器高效率的体现.这片文章介绍下如何基于多个数据表创建索引. 一 无关联多表创建索引 1.1 数据库准备 我们使用任意的两个表作为数据源,这两个表可以属于一个数据库,也可以属于不同的数据库,如果使用两个数据库,则需要两个数据源连接字符串,我们这里使用同一个库的两个表作为示例. 两个表结构如下: 表一: 表二: 1.2 配置data-config.xml 我们之前已经配置好了solr服务器

solr的安装及配置详细教程

1 solr的下载 从Solr官方网站(http://lucene.apache.org/solr/ )下载Solr最新版本,根据Solr的运行环境,Linux下需要下载solr-7.3.1.tgz,windows下需要下载solr-7.3.1.zip. Solr使用指南可参考:https://wiki.apache.org/solr/FrontPage. 本教程中我使用的是solr-4.10.3.zip版本.新版本大体上都是一样的.注意solr-7.3.1需要的jdk的版本须在1.8及其以上.

Solr7.3.0入门教程,部署Solr到Tomcat,配置Solr中文分词器

solr 基本介绍 Apache Solr (读音: SOLer) 是一个开源的搜索服务器.Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现.Apache Solr 中存储的资源是以 Document 为对象进行存储的.每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性.Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件中使用:id进行描述.Solr是

Solr请求概念和配置详解

一.Solr请求概念 Solr最常见的请求类型是在Solr索引中查找相关文档的查询[query].除此之外,Solr还可以处理许多不同类型的请求.所有的请求基本上都是通过请求处理器提交给Solr.搜索处理器[search handler]是查询处理的默认请求处理器,通过调用一个或多个搜索组件,每个组件处理搜索请求的一部分,从而满足查询各个阶段的要求.例如,通过搜索组件执行主查询,其中分面.搜索结果高亮和拼写检查都有各自的搜索组件.要让查询请求能够使用主搜索组件,需要通过一个或多个查询解析器对查询