9.Solr4.10.3数据导入(post.jar方式和curl方式)

转载请出自出处:http://www.cnblogs.com/hd3013779515/
1.使用post.jar方式
java -Durl=http://192.168.137.168:8080/solr/mycore/update -Ddata=files -jar /usr/local/solr-4.10.3/example/exampledocs/post.jar /usr/local/solr-4.10.3/example/multicore/exampledocs/ipod_other.xml

2.使用curl命令方式

删除所有数据


curl http://192.168.137.168:8080/solr/mycore/update?commit=true -H "Content-Type: text/xml" --data-binary "<delete><query>*:*</query></delete>"

导入XML文档数据

curl http://192.168.137.168:8080/solr/mycore/update?commit=true --data-binary @/usr/local/solr-4.10.3/example/multicore/exampledocs/ipod_other.xml -H ‘Content-type:text/xml; charset=utf-8‘

导入json文档数据

curl http://192.168.137.168:8080/solr/mycore/update?commit=true --data-binary @/home/test/books.json -H ‘Content-type:application/json; charset=utf-8‘

导入csv文档数据

我们的csv(books.csv)文件的内容如下:

id,name,price,inStock,author,series_t,sequence_i,genre_s

0553573403,A Game of Thrones,7.99,true,George R.R. Martin,"A Song of Ice and Fire",1,fantasy

0553579908,A Clash of Kings,7.99,true,George R.R. Martin,"A Song of Ice and Fire",2,fantasy

055357342X,A Storm of Swords,7.99,true,George R.R. Martin,"A Song of Ice and Fire",3,fantasy

0553293354,Foundation,7.99,true,Isaac Asimov,Foundation Novels,1,scifi

0812521390,The Black Company,6.99,false,Glen Cook,The Chronicles of The Black Company,1,fantasy

0812550706,Ender‘s Game,6.99,true,Orson Scott Card,Ender,1,scifi

0441385532,Jhereg,7.95,false,Steven Brust,Vlad Taltos,1,fantasy

0380014300,Nine Princes In Amber,6.99,true,Roger Zelazny,the Chronicles of Amber,1,fantasy

0805080481,The Book of Three,5.99,true,Lloyd Alexander,The Chronicles of Prydain,1,fantasy

080508049X,The Black Cauldron,5.99,true,Lloyd Alexander,The Chronicles of Prydain,2,fantasy

为了能够将上面的csv数据正确的导入,我们需要对solrconfig.xml文件进行如下修改:

<requestHandler name="/update/csv" class="solr.CSVRequestHandler" startup="lazy">
<lst name="defaults">
   <str name="separator">,</str>
   <str name="header">true</str>
   <str name="skip">genre_s</str>
   <str name="encapsulator">"</str>
</lst>
</requestHandler>

说明:

startup="lazy":通过该参数告诉solr在第一次添加时才实例化这个更新处理程序

<str name="separator">,</str> : 通过该参数告诉solr 字段之间是通过“,”分隔

<str name="header">true</str>:通过该参数告诉solr在数据项之前含有头信息

<str name="skip">genre_s</str> :通过该参数告诉solr,publish_date 这列数据需要忽略掉

<str name="encapsulator">"</str>:通过该参数告诉solr数据项是通过双引号(")进行封装的

设置完毕,重启solr,并提交数据:

curl http://192.168.137.168:8080/solr/mycore/update?commit=true --data-binary @/home/test/books.csv -H ‘Content-type:text/csv; charset=utf-8‘
时间: 2024-12-23 21:49:26

9.Solr4.10.3数据导入(post.jar方式和curl方式)的相关文章

10.Solr4.10.3数据导入(DIH全量增量同步Mysql数据)

转载请出自出处:http://www.cnblogs.com/hd3013779515/ 1.创建MySQL数据 create database solr; use solr; DROP TABLE IF EXISTS student; CREATE TABLE student ( id char(10) NOT NULL, stu_name varchar(50) DEFAULT NULL, stu_sex int(1) DEFAULT NULL, stu_address varchar(20

solr-4.10.2版本使用tomcat7部署

当前版本仅限于solr-4.10.2版本.默认环境使用的是jdk1.7,tomcat7.环境自己配置.网上一堆堆的. 1.下载相应的文件(solr-4.10.2.zip). 官网地址:http://lucene.apache.org/solr/ 2.将solr-4.10.2.zip文件解压.例:F:\solr-4.10.2 3.找到F:\solr-4.10.2\example目录中的solr文件,复制一份至硬盘中,并改名为solrHome(F:\solrHome). 4.找到F:\solrHom

将Mysq数据导入solr索引库

本文的基础环境都是在centos 64bit,jdk1.7.79 将mysql 的jar 包添加到/home/hadoop/cloudsolr/solr-4.10.4/contrib/dataimporthandler/lib 下 修改对应的solrconfig.xml 文件我的core 是collection1,配置文件example/solr/collection1/conf/solrconfig.xml 在配置文件中添加了: <lib dir="/home/hadoop/clouds

zookeeperr3.4.5+tomcat7+solr-4.10.1分布式集群搭建

一.   说明 本次分布式部署solr是在两台服务器(10.21.16.31和10.21.16.34)上部署5个结点,10.21.16.31服务器部署3个结点,10.21.16.34服务器部署2个结点 二.   下载需要的工具包 zookeeper-3.4.5.tar.gz,tomcat-7.0.50.tar.gz,solr-4.10.1.tgz(jdk必须是7,可以使用系统自带的openJDK) 三.   添加用户 分别在两台服务器上添加solr用户 useradd  solr passwd

2.Linux环境下配置Solr4.10.3

1.准备阶段 操作系统:CentOS 6.8 安装包:/home/test solr-4.10.3.tgz.tar IK Analyzer 2012FF_hf1.zip jdk-8u121-linux-i586.tar.gz apache-tomcat-6.0.51.tar.gz 2.jdk和tomcat安装:略3.安装solr (1)解压solrtar -zxvf solr-4.10.3.tgz.tar -C /usr/local (2) solr.war copy到tomcat下cp /us

SqlServer2012数据导入

1.选择数据库,右击[任务]-->[导入数据]: 2.选择对应的数据源,和数据文件,下一步: 3.填写服务器地址,和数据库的登录信息,选择数据库名称: 4.复制一个或多个表或试图的数据: 5.将原表和目标表相匹配: 6.查看映射信息: 7.将 [出错时]和[截断时]更改为[忽略]: 8.完成向导, 9.点击完成: 10.数据导入成功!

(4.10) 快速导入数据

SQL Server快速导入数据分享 Posted in Other and tagged Database, 数据库, MSSQL, SQL Server, 导入数据, 分享on Apr 26, 2014. Viewd 61 times. 目录 目录 1.CTE 2.OpenRowSet/OpenDataSource 3.BULK INSERT 4.bcp 5.Shell 文/温国兵 SQL Server快速导入数据,可以尝试的方法如下:CTE.OpenRowSet/OpenDataSourc

solr 4.8+mysql数据库数据导入 + mmseg4j中文全文索引 配置笔记

1.如何将solr部署,请参考之前的文章 2.按上述配置好后,在solr_home文件夹中,将包含collection1文件夹,这就是solr的一个实例.下面我们来看看collection1中的文件内容. collection1中包含conf和data两个子文件夹.data中包含tlog和index(如果没有也没关系,稍后再solr建立索引时,将会被创建).tlog是记录日志的文件夹,index是存放索引的文件夹.conf中包含lang文件夹和若干文件.lang文件夹中包含的是词库文件,但是so

solr 学习之数据导入

将数据库中的数据导入到我们的solr索引库中(DataImportHandler) 1.将jdbc的jar包和solr包中的DataImport的jar包拷贝到webapp中solr/WEB-INF/lib目录 /opt/tools/solr-4.10.3/dist目录中: solr-dataimporthandler-4.10.3.jar solr-dataimporthandler-extras-4.10.3.jar 2.添加数据库的驱动包 mysql-connector-java-5.1.