solr简单搭建与使用

安装步骤:

java环境, jdk1.8

从官网下载最新的solr7.5

wget http://mirrors.hust.edu.cn/apache/lucene/solr/7.5.0/solr-7.5.0.tgz

解压 :tar -zxvf solr-7.5.0.tgz -C /usr/local/

添加环境变量:vim /etc/profile

#solr7.5

export PATH=$PATH:/usr/local/solr-7.5.0/bin/

启动失败原因:

这是因为使用的是root用户所以提示我们要加一个强制启动的参数,那么我们接受它的建议重新启动,输入命令./solr start -force ,当看到下面的输出的时候就说明我们启动成功了,这里我们使用的是它默认的端口,我们也可以加上-p参数来使用其它的端口

启动:solr start -force -p 8982

Solr相关命令:

solr 启动、停止、重启命令

solr start -p 端口号 -force

solr stop -all

solr restart -p 端口号 -force

三:使用命令添加/删除 core

Create

solr create -c name -force

delete

solr delete -c name

示例:创建名为 mote 的core,并访问这个core

访问:浏览器输入我们的ip+端口号就可以访问了

IK分词器

下载:ik-analyzer-solr7-7.x.jar

https://search.maven.org/search?q=com.github.magese

上传到 /usr/local/solr-7.5.0/server/solr-webapp/webapp/WEB-INF/lib/ 目录下

vim /usr/local/solr-7.5.0/server/solr/mote/conf/managed-schema

添加:

<!-- 定义ik分词器 -->

<fieldType name="text_ik" class="solr.TextField">

<analyzer type="index">

<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

<analyzer type="query">

<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true"/>

<filter class="solr.LowerCaseFilterFactory"/>

</analyzer>

</fieldType>

重启Solr   solr restart  -force

添加自定义字段:

例:

<fieldType name="text_ik" class="solr.TextField">

<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

<field name="title_ik" type="text_ik" indexed="true" stored="true"/>

<field name="website_id_ik" type="plong" indexed="true" stored="true" multiValued="false" />

<fieldType name="int" class="solr.TrieIntField" positionIncrementGap="0" docValues="true" precisionStep="0"/>

<field name="content_type_ik" type="int" indexed="true" stored="true" multiValued="false" />

<field name="content_id_ik" type="plong" indexed="true" stored="true" multiValued="false" />

定义 ik分词器的 拓展/停用 词典

在 solr-7.5.0\server\solr-webapp\webapp\WEB-INF 新建classes目录

在classes新建三个文件

ext.dic         #用于扩展,添加词语

stopword.dic        #用于停用,添加词语

IKAnalyzer.cfg.xml     #用于定义扩展和停用

vim IKAnalyzer.cfg.xml

添加:

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">

<properties>

<comment>IK Analyzer 扩展配置</comment>

<!--用户可以在这里配置自己的扩展字典-->

<entry key="ext_dict">ext.dic;</entry>

<!--用户可以在这里配置自己的扩展停止词字典-->

<entry key="ext_stopwords">stopword.dic;</entry>

</properties>

solr restart  -force

测试分词

mysql数据库导入solr

下载 mysql 驱动包:mysql-connector-java-x.x.x.jar,绝大部分jar包在maven仓库都能找到

将 mysql 驱动包导入 solr :将下载下来的 mysql-connector-java-x.x.x.jar 拷贝到 solr\server\solr-webapp\webapp\WEB-INF\lib 下;

将solr{home}\dist目录下的:solr-dataimporthandler-7.4.0.jar和solr-dataimporthandler-extras-7.5.0.jar这两个jar包拷贝到 solr\server\solr-webapp\webapp\WEB-INF\lib下

vim /usr/local/solr-7.5.0/server/solr/mote/conf/solrconfig.xml

添加:

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">

<lst name="defaults">

<str name="config">data-config.xml</str>

</lst>

</requestHandler>

# solrconfig.xml配置文件主要定义了solr的一些处理规则,包括索引数据的存放位置,更新,删除,查询的一些规则配置。相当于是基础配置文件。

在solr的conf目录下创建data-config.xml文件,由solrconfig.xml定义

vim /usr/local/solr-7.5.0/server/solr/mote/conf/data-config.xml

添加:

<?xml version="1.0" encoding="UTF-8" ?>

<dataConfig>

<dataSource type="JdbcDataSource"

driver="com.mysql.jdbc.Driver"

url="jdbc:mysql://192.168.231.200:3306/huang"

#指定数据库库名

user="huang"

password="123123"/>

#指定数据库账号密码

<document>

<entity name="user1" query="SELECT * from user1">

#指定数据库表名,sql语句

<field column="id" name="id"/>

<field column="name" name="name"/>

#指定数据库字段,需要managed-schema配置文件中确定

</entity>

</document>

</dataConfig>

vim /usr/local/solr-7.5.0/server/solr/mote/conf/managed-schema

添加:

<field name="name" type="string" indexed="true" stored="true"/>

注:managed-schema文件本身已经有id字段的规则不需要添加managed_schema是在使用solr建立core时的配置(core连接配置和索引库),solr根据它确定如何对文档建立索引到索引库中,每个core在建立前都需要设计好managed_schema

重启solr

登入web界面测试

原文地址:https://www.cnblogs.com/hxqxiaoqi/p/10647260.html

时间: 2024-10-08 20:31:03

solr简单搭建与使用的相关文章

solr 简单搭建 数据库数据同步(待续)

原来在别的公司负责过文档检索模块的维护(意思就是不是俺开发的啦).所以就稍微接触和研究了下文档检索. 文档检索其实是全文检索,是通过一种技术把N多文档进行一定规律的切割归类,然后创建易于搜索的索引式文件,然后搜索具有某些规律的文档时,能够通过快速定位索引,然后根据索引提供的信息精确定位到文档从而实现迅速找到文档.这个文档一般成为条目. 上家公司的时候使用的是Lucene加上Zoie实现的.lucene是apache下的开源项目,不过并不是全文检索的实现,而是一个全文检索的引擎,是一个架构,是其他

(1)Jenkins Linux环境下的简单搭建

(1)Jenkins Linux环境下的简单搭建 Jenkins是一个开源软件项目,旨在提供一个开放易用的软件平台,使软件的持续集成变成可能. ----百度百科 这是一款基于Java开发的工具.种种原因,最近刚开始接触,决定研究一下.Jenkins的搭建方法不止一种,一下就是个人总结的其中一种,文章内容比较浅显,不足之处,欢迎指正. 首先,所需要准备的工具JDK.Maven.资料上显示JDK版本最好高于1.7,并没有研究1.7以下版本,所谓"没有实际调研,就没有发言权",在此就不做过多

LVS-NAT模式简单搭建

LVS作为一款优秀的负载均衡软件,一直受到很多企业的青睐,虽然性能比不上价格昂贵的负载均衡硬件,但对于大部分的业务场景,LVS还是能出色地胜任的. LVS工作在网络的第四层,内核的tcp/ip栈上,这也决定了它在所有负载均衡软件中性能是最好的. LVS主要由两部分组成,一个是工作在用户空间的ipvsadm,另一个是工作在内核上的ipvs.ipvsadm主要负载管理集群服务,包括添加.删除.修改集群服务.对数据包进行监控等,真正起到负载均衡的是ipvs.ipvs主要监听在INPUT钩子函数中,一旦

Solr环境搭建

记录一下Solr环境搭建,基于Solr 4.6.0. 一.配置Tomcat 下载Tomcat 7.0.新建一个solr文件夹,解压tomcat到solr目录下: solr tar -zxvf apache-tomcat-7.0.69.tar 启动tomcat: ./apache-tomcat-7.0.69/bin/catalina.sh start 访问8080端口测试. 二.配置solr solr下载地址:http://archive.apache.org/dist/lucene/solr/

springmvc4环境简单搭建和定时任务

之前复制粘贴创建了几个ssm的项目,然而回头让自己写的时候还是一头雾水,究其原因是spring的陌生.仅仅是写过几个helloworld而已.而且是照着写.我都不知道springmvc到底需要多少jar,都用来干嘛.所以,接下来要用心看spring原理了. 最近由于有定时任务的需求,简单搭建了一个springmvc4的helloworld. ide采用的是idea,当然eclipse应该也是没问题的,因为都是maven项目. 1.创建好maven结构. 可以通过new->project->ma

ubuntu13.04下ftp的简单搭建过程

本文主要介绍一下ubuntu13.04下ftp的简单搭建过程: 主要实现基本的功能: l 实现匿名用户访问 l 上传资料 l 实现对特定ip或ip段开放服务 l 等等... 下面介绍一下安装过程: Ubuntu自带的FTP服务器是vsftpd. 1.安装vsftpd 对于ubuntu下相对简单只需要一条 sudo apt-get install vsftpd 安装默认在/src下建立一个ftp目录. 应该可以看到一个空白内容的ftp 文件. 默认状态下是可以匿名下载,但不能写入或是上传 2.设置

DHCP 简单搭建 本人初学者 &nbsp; 勿喷

首先呢,本人属于初学者,只是为了当笔记看,望大神们多多指点,写的不好,勿喷哦! 想要搭建DHCP首先要一个环境,以下是在两台虚拟机上的实验,所以环境准备需要关掉防火墙,关闭SELINUX,安装DHCP服务,环境准备就不写了,下面是本人在两台RHEL6.5虚拟机上的简单搭建过程: 两台虚拟机本人设置是这样的,服务器端与客户机端都与自己主机名字相同,以便于区分.当然了在虚拟机上实验需要两台虚拟机设置同样的特定虚拟网络在一个频道. 服务器端上的配置 [[email protected] ~]# vim

十分钟用Windows服务器简单搭建DHCP中继代理!!

                     十分钟用Windows服务器简单搭建DHCP中继代理!! 一.什么是中继代理? 大家都知道DHCP分配地址都需要用到IP广播,但是广播是不能在两个网段之间进行的.那么和DHCP服务器不是在同一个网段的客户机怎么获得相应的IP地址呢?这时,就要用到DHCP中继代理了. 在另一个Windows服务器上只要配备两块网卡,再安装一个简单的服务器"角色"就可以实现DHCP中继代理了! 二.实验拓补图 三.实验步骤 1.配置DHCP服务器 1.1).注意,

FFmpeg Windows 开发环境简单搭建 教程

本文来自:http://www.itechzero.com/ffmpeg-windows-develop-environment-simply-set-up-tutorial.html FFmpeg 是一个优秀的程序库,开源.跨平台并且使用者众多,可以使用在 Windows 和 Linux 等平台下,本文将简单讲解 Windows 平台下 FFmpeg 开发环境的简单搭建过程. 平台:Windows 8.1 专业版 + Visual Studio 2013 打开 FFmpeg 官网下载页面,直接