Solr7 安装部署 管理界面介绍

Solr7 安装部署 管理界面介绍

本章重点介绍CentOS 安装部署Solr7 ,Solr的管理界面介绍,添加核心Core配置,Dataimport导入数据,Documents 在线维护索引,Query复杂查询和一些常见问题处理办法。

什么是Solr

Solr 是Apache下的一个顶级开源项目,采用Java开发,基于Lucene的全文搜索服务器。Solr可以独立运行在Jetty、Tomcat等这些Servlet容器中。

这里谈到了Lucene,它是一个开放源代码的全文检索引擎工具包。提供了完整的查询引擎和索引引擎,目的是为开发人员提供工具包,以方便的在系统中实现全文检索的功能。
而Solr 的目标是打造一款企业级的搜索引擎系统,可以独立运行。并且Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。

Solr7 安装部署

首先安装环境的jdk是 jdk1.8 或者更高,建议tomcat是tomcat8.0或者更高

You will need the Java Runtime Environment (JRE) version 1.8 or higher

[[email protected] solr-server]$wget http://mirror.bit.edu.cn/apache/lucene/solr/7.1.0/solr-7.1.0.zip
[[email protected] solr-server]$unzip solr-7.1.0.zip
[[email protected] solr-server]$ls
apache-tomcat-8.5-solr  solr-7.1.0
[[email protected] solr-server]$mkdir -p apache-tomcat-8.5-solr/webapps/solr
[[email protected] solr-server]$cd apache-tomcat-8.5-solr/webapps/solr/
[itdragon[email protected] solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/solr-webapp/webapp/* ./
[[email protected] solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/lib/ext/* ./WEB-INF/lib/
[[email protected] solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/lib/metrics*.* ./WEB-INF/lib/
[[email protected] solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/dist/solr-dataimporthandler-* ./WEB-INF/lib/
[[email protected] solr]$cd ../../
[[email protected] apache-tomcat-8.5-solr]$mkdir solrhome
[[email protected] apache-tomcat-8.5-solr]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/solr/* ./solrhome/
[[email protected] apache-tomcat-8.5-solr]$vim webapps/solr/WEB-INF/web.xml
<env-entry>
   <env-entry-name>solr/home</env-entry-name>
   <env-entry-value>solrhome地址,pwd查看</env-entry-value>
   <env-entry-type>java.lang.String</env-entry-type>
</env-entry>
<!--
  <security-constraint>
    ......省略
  </security-constraint>
-->
[[email protected] apache-tomcat-8.5-solr]$cd bin/
[[email protected] apache-tomcat-8.5-solr]$./startup.sh

第一步:系统环境准备:jdk版本在1.8,tomcat8.5
第二步:下载solr7,并解压在当前目录
第三步:在tomcat,webapps目录下创建solr目录,并将solr-7.1.0/server/solr-webapp/webapp/* 目录下的所有内容拷贝过去
第四步:将需要的jar导入到 WEB-INF/lib/ 下
第五步:在tomcat目录下创建solrhome(目录名自定义),并将solr-7.1.0/server/solr/* 目录下的所有内容拷贝过去
第六步:修改WEB-INF/web.xml 文件,指定solrhome的位置,并注释security-constraint 权限内容
第七步:启动tomcat,并访问http://ip:port/solr/index.html#/
注意:访问http://ip:port/solr/ 显示404,目前还没有找到原因,网上说jar没到导入,可是笔者都导入了。

看到管理页面说明安装成功

存在的问题
1 80端口占用
修改 tomcat/conf/server.xml 文件,更换端口号。
2 Logging页面,日志不能正常显示

[[email protected] solr]$mkdir -p WEB-INF/classes
[[email protected] solr]$cp /home/itdragon/solr-server/solr-7.1.0/server/resources/log4j.properties ./WEB-INF/classes/

第一步:在tomcat WEB-INF目录下创建classes目录
第二步:将solr-7.1.0/server/resources/目录下的log4j.properties文件拷贝到classes目录中,重启Solr

管理界面介绍

添加核心Core

在管理页面,点击Core Admin,选择AddCore,添加核心

name:自定义的名字,建议和instanceDir保持一致
instanceDir: solrhome目录下的实例类目
dataDir:默认填data即可
config:指定配置文件,new_core/conf/solrconfig.xml
schema:指定schema.xml文件,new_core/conf/schema文件(实际上是managed-schema文件)
注意!在scheme下面有一个感叹号!
instanceDir and dataDir need to exist before you can create the core

如果你不管他,直接点击Add Core 会提示 solrconfig.xml 文件找不到

Error CREATEing SolrCore ‘new_core‘: Unable to create core [new_core] Caused by: Can‘t find resource ‘solrconfig.xml‘ in classpath or ‘/home/itdragon/solr/apache-tomcat-8.5/solrhome/new_core‘

解决方法如下

[[email protected] new_core]$mkdir conf
[[email protected] new_core]$cp -r /home/itdragon/solr-server/solr-7.1.0/server/solr/configsets/_default/conf/* ./conf/
[[email protected] solrhome]$cp -r /home/itdragon/solr-server/solr-7.1.0/contrib/ ./
[[email protected] solrhome]$cp -r /home/itdragon/solr-server/solr-7.1.0/dist/ ./
检查solrconfig.xml和contrib目录,dist目录的相对位置
<!--
<lib dir="${solr.install.dir:../../../..}/contrib/extraction/lib" regex=".*\.jar" />
......省略
-->
<lib dir="${solr.install.dir:../../}/contrib/extraction/lib" regex=".*\.jar" />
......省略

第一步:将solr-7.1.0/server/solr/configsets/_default/目录下的conf 拷贝到 new_core 目录下。正确的目录结构:new_core/conf/solrconfig.xml
第二步:将contrib目录,dist目录拷贝到solrhome目录中
第三步:检查solrconfig.xml文件配置的路径是否正确,重启服务

重启服务后即可正常创建Core,然后instanceDir文件夹(new_core)里会自动生成一个core.properties文件

name=new_core
config=solrconfig.xml
schema=schema.xml
dataDir=data

第二次创建core,就不用这么麻烦了,直接把第一次创建的new_core目录复制一份,修改core.properties文件中的name 即可。
在Core Selector 中选择刚创建的 new_core,会出现很多菜单。这是本章的另一个重点。重点学习的内容:Query(查询页面),Documents (索引文档),Dataimport(导入数据),Analysis(分析,下章节和中文分词一起介绍)。其他了解即可。

Dataimport(导入数据)

点击Dataimport 显示 Sorry, no dataimport-handler defined! 解决方法如下

[[email protected] ~]$cd solr-server/apache-tomcat-8.5-solr/solrhome/contrib/dataimporthandler/lib
# 导入solr-dataimporthandler 和 mysql-connector-java jar包
[[email protected] solrhome]$vim new_core/conf/solrconfig.xml
<lib dir="${solr.install.dir:../../}/contrib/dataimporthandler/lib" regex=".*\.jar" />
......省略
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
    <lst name="defaults">
      <str name="config">data-config.xml</str>
    </lst>
</requestHandler>
[[email protected] solrhome]$vim new_core/conf/data-config.xml
<?xml version="1.0" encoding="UTF-8" ?>
<dataConfig>
<dataSource type="JdbcDataSource"
          driver="com.mysql.jdbc.Driver"
          url="jdbc:mysql://localhost:3306/jpa"
          user="root"
          password="root"/>
<document>
    <entity name="product" query="SELECT pid,name,catalog,catalog_name,price,description,picture FROM products ">
         <field column="pid" name="id"/>
         <field column="name" name="product_name"/>
<field column="catalog" name="product_catalog"/>
         <field column="catalog_name" name="product_catalog_name"/>
         <field column="price" name="product_price"/>
         <field column="description" name="product_description"/>
         <field column="picture" name="product_picture"/>
    </entity>
</document>   

</dataConfig>

第一步:进入solrhome/contrib/dataimporthandler/lib 目录下,若没有lib则创建一个,导入solr-dataimporthandler-7.1.0.jar 和 mysql-connector-java-5.1.17.jar 包
第二步:修改new_core/conf/solrconfig.xml 文件,使其加载dataimporthandler/lib下的jar包
第三步:在new_core/conf/solrconfig.xml 文件底部添加DataImportHandler 内容
第四步:在new_core/conf/ 目录下创建data-config.xml(数据库配置和对应的字段),重启服务

jar包和sql文件:
https://github.com/ITDragonBlog/daydayup/tree/master/Solr/data-import-jar
如果出现下图内容则说明配置成功。

Command:full_import:全量导入;delta_import:增量导入。
选择 全量导入,Execute执行,Refresh Status刷新查看状态,其他都选默认即可。
Clean:在索引开始构建之前是否删除之前的索引,默认为true
Commit:在索引完成之后是否提交。默认为true
Execute:执行导入
Refresh Status:刷新后才能看到数据发生了变化(点一次刷新一次)

Documents (索引文档)

索引的增加,修改,删除相关操作。其中修改的逻辑是先删除后增加。

比较重要的是前三个参数
Request-Handler(qt):update(新增,更新和删除都用update)
Document Type:提交的索引文档类型,有JSON、XML等格式
Document(s):提交的索引文档内容
Commit Within:每1000毫秒执行
Overwrite:true,若文档存在则默认覆盖

删除索引:删除用json格式会出错,用xml格式后面需添加< commit/>

工作中,我们不可能为了个别数据去写代码修改数据,那么熟练使用Documents,对我们的工作有很大的帮助。

Query(查询页面)

查询所有价格在10到20之间的数据,并以价格降序输出商品类目名,商品标题,商品价格信息。

Request-Handler(qt):select查询操作
q(query):查询条件,key:value 形式,只能满足简单的查询
fq(filter query):过滤条件。对q的补充,实现复杂的查询。如:product_price:[10.0 TO 20.0] 表示价格在10~20之间。" * " 表示无限,[ * TO 20.0] 表示小于20.0
sort:对查询结果排序。如:product_price desc 表示价格降序
start,rows,开始页数,和每页多少条,简称页码
fl(field list):指定那些字段有返回值。多个值用","分隔。如:product_catalog_name,product_name,product_price
df(default field):默认域,当q查询没有key的时候,发挥作用
wt(write type):输出格式,一般都是json
hl(high light):高亮,搜索的结果若不高亮,那就没啥意义了。下一章会介绍

其他

Dashboard:
显示了该Solr实例开始启动运行的时间、版本、系统资源(物理内存,交换空间)、jvm等信息
Logging:Solr运行日志信息
Java Properties:
Solr在JVM 运行环境中的属性信息,包括类路径、文件编码、jvm内存设置等信息。
Tread Dump:
显示Solr Server中当前活跃线程信息,同时也可以跟踪线程运行栈信息。
Overview:
包含基本统计如当前文档数;和实例信息如当前核心的配置目录
Files:
在线预览solrhome/new_core/conf/* 文件或者目录
Ping:
请求来检查核心是否启动并响应请求,点击后显示响应的毫秒数
Plugins / Stats:
插件及其状态

总结

  • Solr7是基于Lucene的全文检索服务器,可以独立运行在servlet容器中
  • Solr7的安装部署需要注意 tomcat/webapps/solr 和 solrhome 两个目录
  • 创建Solr Core需要注意 solrconfig.xml文件在new_core/conf目录中
  • Query查询,q + fq 实现复杂的查询,sort排序,fl指定回显数据,hl高亮
  • Documents,支持新增,更新,删除索引文档
  • Dataimport,导入数据,需要注意配置 solrconfig.xml 文件和创建 data-config.xml 文件

到这里Solr7 的安装部署,管理界面介绍就结束了。感谢阅读!欢迎点评!!

时间: 2024-11-06 12:44:48

Solr7 安装部署 管理界面介绍的相关文章

Linux安装web管理界面-Webmin控制面板

1.下载相应的软件包 http://www.webmin.com/download.html 官网 [[email protected] ~]# wget http://prdownloads.sourceforge.net/webadmin/webmin-1.770-1.noarch.rpm [[email protected] ~]# rpm -vih webmin-1.770-1.noarch.rpm [[email protected] ~]# yum -y install openss

Storm介绍及安装部署

本节内容: Apache Storm是什么 Apache Storm核心概念 Storm原理架构 Storm集群安装部署 启动storm ui.Nimbus和Supervisor 一.Apache Storm是什么 Apache Storm是自由开源的分布式实时计算系统,擅长处理海量数据,适用于数据实时处理而非批处理. 批处理使用的大多是鼎鼎大名的hadoop或者hive,作为一个批处理系统,hadoop以其吞吐量大.自动容错等优点,在海量数据处理上得到了广泛的使用.但是,hadoop不擅长实时

3_HA介绍和安装部署

一.hadoop 2.x产生背景 1.hadoop 1.x中hdfs和mr在高可用和扩展性等方面存在问题.2.hdfs存在的问题:NN单点故障,难以应用于在线场景:NN压力过大,内存受限,影响系统扩展性.3.mr存在的问题:1.x难以支持除mr之外的计算框架,如spark和storm(mr一般得到结果时间较长,storm和spark可以很快得到结果). 二.hadoop 1.x与hadoop2.x区别 1.2.x由hdfs.mr和yarn三个分支构成,yarn是分布式的资源管理器(资源包括内存,

Linux安装完Tomcat后无法登陆管理界面

今天在Linux中安装完Tomcat后无法登陆Tomcat的管理界面,也就无法利用Tomcat管理界面来部署项目. 在Windows中一般配置完Tomcat后,只要在[conf]目录下的“tomcat-user.xml”文件中配置如下的即可: <user username="admin" password="admin" roles="manager-gui" /> 但是我在Linux中也是这么配置,但是想登陆管理界面时则是403 A

Kafka介绍及安装部署

本节内容: 消息中间件 消息中间件特点 消息中间件的传递模型 Kafka介绍 安装部署Kafka集群 安装Yahoo kafka manager kafka-manager添加kafka cluster 一.消息中间件 消息中间件是在消息的传输过程中保存消息的容器.消息中间件在将消息从消息生产者到消费者时充当中间人的作用.队列的主要目的是提供路由并保证消息的传送:如果发送消息时接收者不可用,消息对列会保留消息,直到可以成功地传递它为止,当然,消息队列保存消息也是有期限的. 二.消息中间件特点 1

Zabbix介绍及安装部署

.    zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案,zabbix能监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题. zabbix由2部分构成,zabbix server与可选组件zabbix agent zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris,

HBase介绍、搭建、环境、安装部署

hadoop培训课程:HBase介绍.搭建.环境.安装部署 1.搭建环境 部署节点操作系统为CentOS,防火墙和SElinux禁用,创建了一个shiyanlou用户并在系统根目录下创建/app目录,用于存放Hadoop等组件运行包.因为该目录用于安装hadoop等组件程序,用户对shiyanlou必须赋予rwx权限(一般做法是root用户在根目录下创建/app目录,并修改该目录拥有者为shiyanlou(chown –R shiyanlou:shiyanlou /app). Hadoop搭建环

MySQL-5.6.38 安装部署及介绍

第1章 MySQL简介及部署 1.1 介绍 1.1.1 什么是数据 数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质.状态以及相互关系等进行记载的物理符号或这些物理符号的组合.它是可识别的.抽象的符号. 1.1.2 数据库管理系统种类---关系型 优点: 强大的查询功能 强一致性 二级索引 RDBMS:Oracle.MySQL.mssql(SQL Server).PG(postgresql) 适用场景:数据安全性要求较高的应用场景 1.1.3 数据库管理系统种类---非关系型 优点

hue框架介绍和安装部署

大家好,我是来自内蒙古的小哥,我现在在北京学习大数据,我想把学到的东西分享给大家,想和大家一起学习 hue框架介绍和安装部署 hue全称:HUE=Hadoop User Experience 他是cloudera公司提供的一个web框架,和其他大数据框架整合,提供可视化界面 hue的架构 1.hue UI:hue提供一个可视化的web界面 2.hue server:hue的服务器,对外提供一个web的访问 3.hue db:存储整合框架的信息 1.Hue的介绍 HUE=Hadoop User E