Solr5.0快速入门

一,安装环境 
硬件:虚拟机 
操作系统:Centos 6.4 64位 
IP:10.51.121.10 
主机名:datanode-4 
安装用户:root 
安装系统要求:需要先安装JDK7或者以上版本,推荐JDK7U55或者以后版本。

二,安装JDK7 
安装JDK7U55或者以上版本。这里安装JDK1.7.0_75。 
下载地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html 
1,下载jdk-7u75-linux-x64.tar.gz,执行:#tar -zxvf jdk-7u75-linux-x64.tar.gz 
到/usr/lib目录。解压之后的目录为:/usr/lib/jdk1.7.0_75

2,在/root/.bash_profile中添加如下配置:

export JAVA_HOME=/usr/lib/jdk1.7.0_75
export PATH=$JAVA_HOME/bin:$PATH

3,使环境变量生效#source ~/.bash_profile 
4,安装验证# java -version 
java version “1.7.0_75” 
Java(TM) SE Runtime Environment (build 1.7.0_75-b13) 
Java HotSpot(TM) 64-Bit Server VM (build 24.75-b04, mixed mode)

三,安装Solr 
1,下载Solr5.0,下载URL:http://archive.apache.org/dist/lucene/solr/5.0.0/solr-5.0.0.tgz 
2,执行:#tar -zxvf solr-5.0.0.tgz 
到/root/nutch目录。解压之后的目录为:/root/nutch/solr-5.0.0

四,启动Solr服务 
1,进入solr的安装目录,/root/nutch/solr-5.0.0 
2,执行,#./bin/solr start -e cloud -noprompt 
Welcome to the SolrCloud example! 
Starting up 2 Solr nodes for your example SolrCloud cluster. 
… 
Started Solr server on port 8983 (pid=8404). Happy searching! 
… 
Started Solr server on port 7574 (pid=8549). Happy searching! 
… 
SolrCloud example running, please visit http://localhost:8983/solr

Solr在2个节点上运行,一个端口是8983,另一个端口是7574。并自动建立了名称为gettingstarted的collection,此collection有2个shard,每个shard有replicas。 
3,在浏览器中输入:http://10.51.121.10:8983/solr/ 

四,建立索引 
指定需要建立索引数据源,数据源可以是HTML, PDF, Microsoft Office 文件(比如 MS Word、Excel),平面文件等。 
这里为solr安装目录下的docs文件夹中的文件建立索引。 
1,执行#bin/post -c gettingstarted docs/

#bin/post -c gettingstarted docs/
java -classpath /solr-5.0.0/dist/solr-core-5.0.0.jar -Dauto=yes -Dc=gettingstarted -Ddata=files -Drecursive=yes org.apache.solr.util.SimplePostTool docs/
SimplePostTool version 5.0.0
Posting files to [base] url http://localhost:8983/solr/gettingstarted/update...
Entering auto mode. File endings considered are xml,json,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
Entering recursive mode, max depth=999, delay=0s
Indexing directory docs (3 files, depth=0)
POSTing file index.html (text/html) to [base]/extract
POSTing file quickstart.html (text/html) to [base]/extract
POSTing file SYSTEM_REQUIREMENTS.html (text/html) to [base]/extract
Indexing directory docs/changes (1 files, depth=1)
POSTing file Changes.html (text/html) to [base]/extract
...
3254 files indexed.
COMMITting Solr index changes to http://localhost:8983/solr/gettingstarted/update...
Time spent: 0:02:27.712

2,为xml文件建立索引

#bin/post -c gettingstarted example/exampledocs/*.xml

3,为JSON文件建立索引

#bin/post -c gettingstarted example/exampledocs/*.json

4,为CSV文件建立索引

#bin/post -c gettingstarted example/exampledocs/books.csv

五,搜索 
Solr可以通过REST 客户端,cURL命令,wget命令等方式来访问搜索。 
1,进入http://10.51.121.10:8983/solr,选择gettingstarted_shard1_replica2,点击Query Tab,在q输入域中输入”solr”,然后点击”Execute Query”按钮,这时可以查到内容为solr的文件。 

2,在Linux Shell中用cURL访问,比如:

# curl "http://localhost:8983/solr/gettingstarted/select?wt=json&indent=true&q=foundation"
# curl "http://localhost:8983/solr/gettingstarted/select?wt=json&indent=true&q=foundation"
{
  "responseHeader":{
    "status":0,
    "QTime":26,
    "params":{
      "indent":"true",
      "q":"foundation",
      "wt":"json"}},
  "response":{"numFound":3105,"start":0,"maxScore":0.13157843,"docs":[
      {
        "id":"UTF8TEST",
        "name":["Test with some UTF-8 encoded characters"],
        "manu":["Apache Software Foundation"],
        "cat":["software",
          "search"],
  ......

3,访问http://10.51.121.10:8983/solr/gettingstarted/browse。 

六,常用命令 
1,solr命令有start, stop, restart, status, healthcheck, create, create_core, create_collection, delete。

# ./bin/solr

Usage: solr COMMAND OPTIONS
       where COMMAND is one of: start, stop, restart, status, healthcheck, create, create_core, create_collection, delete

  Standalone server example (start Solr running in the background on port 8984):

    ./solr start -p 8984

  SolrCloud example (start Solr running in SolrCloud mode using localhost:2181 to connect to ZooKeeper, with 1g max heap size and remote Java debug options enabled):

    ./solr start -c -m 1g -z localhost:2181 -a "-Xdebug -Xrunjdwp:transport=dt_socket,server=y,suspend=n,address=1044"

Pass -help after any COMMAND to see command-specific usage information,
  such as:    ./solr start -help or ./solr stop -help

2,healthcheck命令

[root@datanode-4 solr-5.0.0]# bin/solr healthcheck -c gettingstarted
{
  "collection":"gettingstarted",
  "status":"healthy",
  "numDocs":3296,
  "numShards":2,
  "shards":[
    {
      "shard":"shard1",
      "status":"healthy",
      "replicas":[
        {
          "name":"core_node2",
          "url":"http://10.51.121.10:8983/solr/gettingstarted_shard1_replica2/",
          "numDocs":1633,
          "status":"active",
          "uptime":"0 days, 0 hours, 42 minutes, 6 seconds",
          "memory":"36.9 MB (%7.5) of 490.7 MB"},
        {
          "name":"core_node4",
          "url":"http://10.51.121.10:7574/solr/gettingstarted_shard1_replica1/",
          "numDocs":1633,
          "status":"active",
          "uptime":"0 days, 0 hours, 41 minutes, 44 seconds",
          "memory":"83.2 MB (%17) of 490.7 MB",
          "leader":true}]},
    {
      "shard":"shard2",
      "status":"healthy",
      "replicas":[
        {
          "name":"core_node1",
          "url":"http://10.51.121.10:8983/solr/gettingstarted_shard2_replica2/",
          "numDocs":1663,
          "status":"active",
          "uptime":"0 days, 0 hours, 42 minutes, 6 seconds",
          "memory":"37.1 MB (%7.6) of 490.7 MB"},
        {
          "name":"core_node3",
          "url":"http://10.51.121.10:7574/solr/gettingstarted_shard2_replica1/",
          "numDocs":1663,
          "status":"active",
          "uptime":"0 days, 0 hours, 41 minutes, 44 seconds",
          "memory":"83.3 MB (%17) of 490.7 MB",
          "leader":true}]}]}
时间: 2024-10-13 15:37:57

Solr5.0快速入门的相关文章

EJB3.0快速入门

1.首先介绍运行环境及相关的配置: EJB的运行环境: JAVAEE应用服务器包含Web容器和EJB容器,EJB3.0应用需要运行在EJB容器里. Tomcat目前只是Web容器,它不能运行EJB应用. Jboss作为最常用EJB容器,其自身所带Web服务器部分就是直接使用Tomcat(Jboss的默认端口也为:8080). 相关配置: 1.配置classpath:%JDK安装目录%/lib/dt.jar和tools.jar 2.JDK版本需要1.5以上. 3.为Jboss设置Jboss_HOM

python3.5+django2.0快速入门(一)

因为这篇教程需要用到anaconda的一些操作,如果还不懂anaconda的操作的同学可以看下这篇文章python 入门学习之anaconda篇. 创建python3+的开发环境 直接在终端输入:conda create -n newenv python=3.5 进入我们新建的开发环境newenv linux: source activate newenv window: activate newenv 安装django2.0 直接在终端输入: pip install django ,然后系统会

《ThinkPHP 5.0快速入门》 请求和响应

1.请求对象 //传统调用$request = Request::instance();//实例化对象 $request->url();//获取当前的域名 //继承think\Controller class Index extends Controller(){ public function hello(){ return $this->request->url();//获取当前域名 } } //自动注入请求对象 class Index(){ public function hell

thinkphp5.0快速入门(学习php框架及代码审计)

学习php代码审计,很多人停留在初级阶段,大家都知道很多CMS采用MVC架构, 为了深入学习下框架,一边看着thinkphp5.0官方文档,一边写个简单的登陆注册页面以加深理解. 官网提供了好几个文档,发现这个最简单易懂:https://www.kancloud.cn/thinkphp/thinkphp5_quickstart/147278 前端用bootstrap简单拼凑了下. 我使用的是wamp集成环境,http.conf中设置下public目录为公共目录: <VirtualHost *:8

spring boot2.0快速入门(一)

maven构建方式一:pom.xml文件中用parent标签配置依赖传递 开发工具:eclipse 版本:Oxygen.3a Release(4.7.3a) 开发环境 :win10 步聚1 :新建maven工程 勾选创建一个简单工程,跳过骨架选择,点击下一步,如图: 在配置窗口中输入组织标识,项目名称标识,发布版本,并将打包方式修改为jar,点击完成,如图: 步聚2:修改pom.xml文件 1. 打开pom.xml文件,初始显示代码如下: 2.在pom.xml添加配置如下: 步聚3:在项目中创建

Chapter 0.SymmetricDS快速入门指南( Quick Start Guide)

本文档是SymmetricDS3.6.14文档的第一章节Quick Start Guide文档的翻译,的目的是帮助读者快速搭建一个SymmetricDS集群并普及一些基本概念术语. 本文档描述了如何在两个SymmetricDS节点之间同步两个相同schema的数据库.下面的例子构建了一个分销业务模型,有一个中央数据库(我们叫它root或者corp节点)和多个零售商店的数据库(我们叫它client或者store节点).对于本教程,我们将只有一个store(商店)节点,如下图.如果你愿意,可以再教程

5分钟快速入门angular2。0

让我们从零开始,在JavaScript中建立一个超级简单的角angular2.0的应用. 请看demo <!DOCTYPE html> <html> <head> <title>Angular 2 QuickStart JS</title> <meta name="viewport" content="width=device-width, initial-scale=1"> <link

NSIS 2.0界面快速入门

NSIS 2.0 版本支持定制的用户界面.所谓的 Modern UI(下称 MUI) 就是一种模仿最新的 Windows 界面风格的界面系统.MUI 改变了 NSIS 脚本的编写习惯,它使用 NSIS 的宏来表达,指定 MUI 的属性需要使用宏.所以,诸如 LicenseText, Icon, CheckBitmap, InstallColors 在 MUI 中失去意义. MUI 的内置向导页面 和安装程序有关的向导页面 MUI_PAGE_WELCOME 该向导页面显示欢迎信息 MUI_PAGE

3、Kafka学习分享|快速入门-V3.0

Kafka学习分享|快速入门 这个教程假定你刚开始是新鲜的,没有现存的Kafka或者Zookeeper 数据.由于Kafka控制控制脚本在Unix和Windows平台不同,在Windows平台使用bin\windows\ 代替 bin/,并且更改脚本扩展名为.bat. 第一步:下载编码 下载0.10.2.0版本并且解压它. 第二步:启动服务器 Kafka使用Zookeeper,因此如果你没有Zookeeper server,你需要先启动a ZooKeeper server.你可以使用Kafka的