elasticsearch river 从数据库中导入数据

Elasticsearch中使用reiver-jdbc导入数据

2014-05-13 15:10 本站整理浏览(3384)

Elasticsearch中使用reiver-jdbc导入数据，有需要的朋友可以参考下。

Elastisearch中提供了river模块来从其他数据源中获取数据，该项功能以插件的形式存在，目前已有的river插件包括：

river pluginsedit

1. Supported by Elasticsearch

CouchDB River Plugin
RabbitMQ River Plugin
Twitter River Plugin
Wikipedia River Plugin

2. Supported by the community

ActiveMQ River Plugin (by Dominik Dorn)
Amazon SQS River Plugin (by Alex Bogdanovski)
CSV River Plugin (by Martin Bednar)
Dropbox River Plugin (by David Pilato)
FileSystem River Plugin (by David Pilato)
Git River Plugin (by Olivier Bazoud)
GitHub River Plugin (by uberVU)
Hazelcast River Plugin (by Steve Samuel)
JDBC River Plugin (by Jörg Prante)
JMS River Plugin (by Steve Sarandos)
Kafka River Plugin (by Endgame Inc.)
LDAP River Plugin (by Tanguy Leroux)
MongoDB River Plugin (by Richard Louapre)
Neo4j River Plugin (by Steve Samuel)
Open Archives Initiative (OAI) River Plugin (by Jörg Prante)
Redis River Plugin (by Steve Samuel)
RSS River Plugin (by David Pilato)
Sofa River Plugin (by adamlofts)
Solr River Plugin (by Luca Cavanna)
St9 River Plugin (by Sunny Gleason)
Subversion River Plugin (by Pascal Lombard)
DynamoDB River Plugin (by Kevin Wang)

可以看出，已经覆盖了大部分的数据源，特别是针对关系型数据库提供了统一的jdbc-river来进行数据操作。

elasticsearch-river-jdbc的源码在：https://github.com/jprante/elasticsearch-river-jdbc，该项目提供了详细的文档，下面以SQL Server为例简单说明使用方法。

首先，需要安装elasticsearch-river-jdbc，在elasticsearch目录下执行：

./bin/plugin --install jdbc --url http://xbib.org/repository/org/xbib/elasticsearch/plugin/elasticsearch-river-jdbc/1.1.0.1/elasticsearch-river-jdbc-1.1.0.1-plugin.zip

然后，安装SQLServer的JDBC库，链接为：Microsoft
JDBC Driver。把其中的‘sqljdbc4.jar’复制到elasticsearch安装目录的lib文件夹下。

考虑到elasticsearch集群，以上两个步骤在每个节点上都需要执行。

最后也是最关键的一步，在elasticsearch中建立river，让elasticsearch自动从SQLServer中获取数据。

PUT /_river/mytest_river/_meta
{
    “type” : “jdbc”,
    “jdbc” : {
        “driver”:”com.microsoft.sqlserver.jdbc.SQLServerDriver”,
        “url”:”jdbc:sqlserver://MYSQLSERVERNAME;databaseName=MYProductDatabase”,
        “user”:”admin”,”password”:”Password”,
        “sql”:”select ProductID as _id, CategoryID,ManufacturerID,MfName,ProductTitle,MfgPartNumber from MyProductsTable(nolock)”,
        “poll”:”10m”,
        “strategy” : “simple”,
        “index” : “myinventory”,
        “type” : “product”,
        “bulk_size” : 100,
        “max_retries”: 5,
        “max_retries_wait”:”30s”,
        “max_bulk_requests” : 5,
        “bulk_flush_interval” : “5s”
    }
}

其中，各个参数选项的含义参阅文档：https://github.com/jprante/elasticsearch-river-jdbc/wiki/JDBC-River-parameters

参考文档：

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/modules-plugins.html
http://blog.csdn.net/an74520/article/details/8740065
http://www.techovity.com/create-river-elasticsearch-ms-sql-server-automatic-data-transfer/

时间： 2025-01-31 10:14:26

elasticsearch river 从数据库中导入数据的相关文章

solr4从mysql数据库中导入数据

实际项目中,我们需要把已存在于数据库中的数据导入到solr索引库中,solr给我们提供了一个非常简便的方式DIH,下面我们以mysql数据为例. 1.进入你的core(如collection1),新建一个目录lib. 2.拷贝mysql-connector-java-5.1.14.jar到新建的lib目录中. 3.从solr的解压文件目录中找到“E:\solrbase\example-DIH\solr\db\conf”下的db-data-config.xml文件到你的core(如collecti

solr6.6教程-从mysql数据库中导入数据（三）

整理多半天的solr6.6,终于算是把solr6.6中配置数据库弄出来了,网上的文章千篇一律,各说个的,没有一篇统一覆盖solr6.6版本配置的帖子,本章节我会把配置的一些注意事项一一列举,由于时间原因,本片只介绍如何一次性导入数据,不附带增量导入,想看增量的同学可以在后面的文章中. 1,配置准备本文的前提是你已经配置好了solr,并新创建了一个core,我们下面都会按照前一篇文章中的core_demo为基础开始 2,修改soreconfig.xml 在soreconfig.xml的<req

Java实现Excel导入数据库，数据库中的数据导入到Excel

实现的功能: Java实现Excel导入数据库,如果存在就更新数据库中的数据导入到Excel 1.添加jxl.jar mysql-connector-java.1.7-bin.jar包到项目的lib目录下 2.Excel文件目录:D://book.xls 3.数据库名:javenforexcel 4.表名:stu 5.编写类:连接mysql的字符串方法.插入的方法.实体类表结构如下 : 连接数据库的工具类 package com.javen.db; import java.sql.Co

Java实现Excel导入数据库，数据库中的数据导入到Excel。。转载

自学资料总结实现的功能: Java实现Excel导入数据库,如果存在就更新数据库中的数据导入到Excel 1.添加jxl.jar mysql-connector-java.1.7-bin.jar包到项目的lib目录下 2.Excel文件目录:D://book.xls 3.数据库名:javenforexcel 4.表名:stu 5.编写类:连接mysql的字符串方法.插入的方法.实体类表结构如下 : 连接数据库的工具类 package com.javen.db; import java

将一个数据库中的数据导入另一个数据库（DB2）

将一个数据库中的数据导入另一个数据库(DB2) 我这里举得例子是使用的DB2数据库,其他数据库思路也是这样啦! 1.从db2 数据库中将表中的数据导入本地的excel中 export to d:\mytest.xls of del modified by nochardel coldel0x09 select * from IOUT_BUSI_YWDJMX_TEMP 2.在需要导入的数据库建立一个临时表 --创建临时表 CREATE TABLE NBADV.l_hzcitywa ( fhcode

中文数据库乱码 excel中导入数据到mysql 问题

数据库编码表编码 ide编码必须一致,即可解决问题场景:把这些数据导入数据库,并且得到城市名称拼音的首字母从excel中导入数据到mysql,使用了jxl这个库使用了pinyin4这个库,但是发现有bug import java.io.UnsupportedEncodingException; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException;import ja

使用sqoop将MySQL数据库中的数据导入Hbase

使用sqoop将MySQL数据库中的数据导入Hbase 前提:安装好 sqoop.hbase. 下载jbdc驱动:mysql-connector-java-5.1.10.jar 将 mysql-connector-java-5.1.10.jar 拷贝到 /usr/lib/sqoop/lib/ 下 MySQL导入HBase命令: sqoop import --connect jdbc:mysql://10.10.97.116:3306/rsearch --table researchers --h

把一个数据库中的数据导入另一个数据库中

use master go -- ============================================= -- Basic Create Database Template -- ============================================= IF EXISTS (SELECT * FROM master..sysdatabases WHERE name = N'lbNorthwind') DROP DATABASE lbNorthwind GO

Elasticsearch --- 向es中导入数据

一.从文件导入(用django启动) def zi_dr(request): f = open('c.txt', 'r', encoding='utf-8') action = [ { "_index": "c12", "_type": "doc", "_source": { "title": i.strip(), # 去掉空 } } for i in f] s = time.time