elasticsearch river 从数据库中导入数据

Elasticsearch中使用reiver-jdbc导入数据

2014-05-13 15:10 本站整理 浏览(3384)

Elasticsearch中使用reiver-jdbc导入数据,有需要的朋友可以参考下。

Elastisearch中提供了river模块来从其他数据源中获取数据,该项功能以插件的形式存在,目前已有的river插件包括:

river pluginsedit

1. Supported by Elasticsearch

  • CouchDB River Plugin
  • RabbitMQ River Plugin
  • Twitter River Plugin
  • Wikipedia River Plugin

2. Supported by the community

  • ActiveMQ River Plugin (by Dominik Dorn)
  • Amazon SQS River Plugin (by Alex Bogdanovski)
  • CSV River Plugin (by Martin Bednar)
  • Dropbox River Plugin (by David Pilato)
  • FileSystem River Plugin (by David Pilato)
  • Git River Plugin (by Olivier Bazoud)
  • GitHub River Plugin (by uberVU)
  • Hazelcast River Plugin (by Steve Samuel)
  • JDBC River Plugin (by Jörg Prante)
  • JMS River Plugin (by Steve Sarandos)
  • Kafka River Plugin (by Endgame Inc.)
  • LDAP River Plugin (by Tanguy Leroux)
  • MongoDB River Plugin (by Richard Louapre)
  • Neo4j River Plugin (by Steve Samuel)
  • Open Archives Initiative (OAI) River Plugin (by Jörg Prante)
  • Redis River Plugin (by Steve Samuel)
  • RSS River Plugin (by David Pilato)
  • Sofa River Plugin (by adamlofts)
  • Solr River Plugin (by Luca Cavanna)
  • St9 River Plugin (by Sunny Gleason)
  • Subversion River Plugin (by Pascal Lombard)
  • DynamoDB River Plugin (by Kevin Wang)

可以看出,已经覆盖了大部分的数据源,特别是针对关系型数据库提供了统一的jdbc-river来进行数据操作。

elasticsearch-river-jdbc的源码在:https://github.com/jprante/elasticsearch-river-jdbc,该项目提供了详细的文档,下面以SQL Server为例简单说明使用方法。

首先,需要安装elasticsearch-river-jdbc,在elasticsearch目录下执行:

./bin/plugin --install jdbc --url http://xbib.org/repository/org/xbib/elasticsearch/plugin/elasticsearch-river-jdbc/1.1.0.1/elasticsearch-river-jdbc-1.1.0.1-plugin.zip

然后,安装SQLServer的JDBC库,链接为:Microsoft 
JDBC Driver
。把其中的‘sqljdbc4.jar’复制到elasticsearch安装目录的lib文件夹下。

考虑到elasticsearch集群,以上两个步骤在每个节点上都需要执行。

最后也是最关键的一步,在elasticsearch中建立river,让elasticsearch自动从SQLServer中获取数据。

PUT /_river/mytest_river/_meta
{
    “type” : “jdbc”,
    “jdbc” : {
        “driver”:”com.microsoft.sqlserver.jdbc.SQLServerDriver”,
        “url”:”jdbc:sqlserver://MYSQLSERVERNAME;databaseName=MYProductDatabase”,
        “user”:”admin”,”password”:”Password”,
        “sql”:”select ProductID as _id, CategoryID,ManufacturerID,MfName,ProductTitle,MfgPartNumber from MyProductsTable(nolock)”,
        “poll”:”10m”,
        “strategy” : “simple”,
        “index” : “myinventory”,
        “type” : “product”,
        “bulk_size” : 100,
        “max_retries”: 5,
        “max_retries_wait”:”30s”,
        “max_bulk_requests” : 5,
        “bulk_flush_interval” : “5s”
    }
}

其中,各个参数选项的含义参阅文档:https://github.com/jprante/elasticsearch-river-jdbc/wiki/JDBC-River-parameters

参考文档:

  1. http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/modules-plugins.html
  2. http://blog.csdn.net/an74520/article/details/8740065
  3. http://www.techovity.com/create-river-elasticsearch-ms-sql-server-automatic-data-transfer/
时间: 2024-09-29 23:16:42

elasticsearch river 从数据库中导入数据的相关文章

solr4从mysql数据库中导入数据

实际项目中,我们需要把已存在于数据库中的数据导入到solr索引库中,solr给我们提供了一个非常简便的方式DIH,下面我们以mysql数据为例. 1.进入你的core(如collection1),新建一个目录lib. 2.拷贝mysql-connector-java-5.1.14.jar到新建的lib目录中. 3.从solr的解压文件目录中找到“E:\solrbase\example-DIH\solr\db\conf”下的db-data-config.xml文件到你的core(如collecti

solr6.6教程-从mysql数据库中导入数据(三)

整理多半天的solr6.6,终于算是把solr6.6中配置数据库弄出来了,网上的文章千篇一律,各说个的,没有一篇统一覆盖solr6.6版本配置的 帖子,本章节我会把配置的一些注意事项一一列举,由于时间原因,本片只介绍如何一次性导入数据,不附带增量导入,想看增量的同学可以在后面的文章中. 1,配置准备 本文的前提是你已经配置好了solr,并新创建了一个core,我们下面都会按照前一篇文章中的core_demo为基础开始 2,修改soreconfig.xml 在soreconfig.xml的<req

Java实现Excel导入数据库,数据库中的数据导入到Excel

实现的功能: Java实现Excel导入数据库,如果存在就更新 数据库中的数据导入到Excel 1.添加jxl.jar mysql-connector-java.1.7-bin.jar包到项目的lib目录下­ 2.Excel文件目录:D://book.xls 3.数据库名:javenforexcel 4.表名:stu 5.编写类:连接mysql的字符串方法.插入的方法.实体类­­ 表结构如下 : 连接数据库的工具类 package com.javen.db; import java.sql.Co

Java实现Excel导入数据库,数据库中的数据导入到Excel。。转载

自学资料总结 实现的功能: Java实现Excel导入数据库,如果存在就更新 数据库中的数据导入到Excel 1.添加jxl.jar mysql-connector-java.1.7-bin.jar包到项目的lib目录下­ 2.Excel文件目录:D://book.xls 3.数据库名:javenforexcel 4.表名:stu 5.编写类:连接mysql的字符串方法.插入的方法.实体类­­ 表结构如下 : 连接数据库的工具类 package com.javen.db; import java

将一个数据库中的数据导入另一个数据库(DB2)

将一个数据库中的数据导入另一个数据库(DB2) 我这里举得例子是使用的DB2数据库,其他数据库思路也是这样啦! 1.从db2 数据库中将表中的数据导入本地的excel中 export to d:\mytest.xls of del modified by nochardel coldel0x09 select * from IOUT_BUSI_YWDJMX_TEMP 2.在需要导入的数据库建立一个临时表 --创建临时表 CREATE TABLE NBADV.l_hzcitywa ( fhcode

中文 数据库 乱码 excel中导入数据到mysql 问题

数据库编码  表编码  ide编码 必须一致,即可解决问题 场景:把这些数据导入数据库,并且得到城市名称拼音的首字母 从excel中导入数据到mysql,使用了jxl这个库 使用了pinyin4这个库,但是发现有bug import java.io.UnsupportedEncodingException; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException;import ja

使用sqoop将MySQL数据库中的数据导入Hbase

使用sqoop将MySQL数据库中的数据导入Hbase 前提:安装好 sqoop.hbase. 下载jbdc驱动:mysql-connector-java-5.1.10.jar 将 mysql-connector-java-5.1.10.jar 拷贝到 /usr/lib/sqoop/lib/ 下 MySQL导入HBase命令: sqoop import --connect jdbc:mysql://10.10.97.116:3306/rsearch --table researchers --h

把一个数据库中的数据导入另一个数据库中

use master go -- ============================================= -- Basic Create Database Template -- ============================================= IF EXISTS (SELECT * FROM master..sysdatabases WHERE name = N'lbNorthwind') DROP DATABASE lbNorthwind GO

Elasticsearch --- 向es中导入数据

一.从文件导入(用django启动) def zi_dr(request): f = open('c.txt', 'r', encoding='utf-8') action = [ { "_index": "c12", "_type": "doc", "_source": { "title": i.strip(), # 去掉 空 } } for i in f] s = time.time