HBase表数据导出和导入

本文不是技术收集贴,就是记录一下,因此没有收集所有的HBase表导入导出方式,只是记录一下自己用过的一种。

数据表的导出:

1 $ bin/hbase org.apache.hadoop.hbase.mapreduce.Driver export <tablename> <outputdir> [<versions> [<starttime> [<endtime>]]]

需要注意的是,outputdir指的是HDFS上的路径,建议使用绝对路径(没有试过相对路径)。

数据表的导入:

1 $ bin/hbase org.apache.hadoop.hbase.mapreduce.Driver import <tablename> <inputdir>

需要注意的是有2点:

1 与导出一样,inputdir指的是HDFS上的路径,建议使用绝对路径。

2 table的结构必须事先已经存在。

还有一个比较实用的技巧,当导出数据的HBase版本和需要导入数据的HBase版本不一致时,在数据导入时可以指定备份文件是从哪个版本的HBase中导出来的,如果是从0.94版本的HBase导出来的,则命令如下:

1 $ bin/hbase -Dhbase.import.version=0.94 org.apache.hadoop.hbase.mapreduce.Driver import <tablename> <inputdir>

参考文献:hbase 表数据迁移

时间: 2024-12-16 05:50:25

HBase表数据导出和导入的相关文章

HBase表的数据导出和导入

1. 表数据导出 hbase org.apache.hadoop.hbase.mapreduce.Export test file:///home/hadoop/test (导入到本地) hbase org.apache.hadoop.hbase.mapreduce.Export test /user/hadoop/test (导入到hdfs上) #创建一个test表,一个列簇info hbase(main):004:0* create 'test','info' 0 row(s) in 4.3

数据分页处理系列之二:HBase表数据分页处理

  HBase是Hadoop大数据生态技术圈中的一项关键技术,是一种用于分布式存储大数据的列式数据库,关于HBase更加详细的介绍和技术细节,朋友们可以在网络上进行搜寻,笔者本人在接下来的日子里也会写一个HBase方面的技术专题,有兴趣的朋友们可以稍微的期待一下.不过本章节的重点是介绍下HBase表数据的分页处理,其他的就不多说了. 首先说一下表数据分页中不可回避的一个指标:总记录数.在关系数据库中很容易统计出记录总数,但在HBase中,这却是一个大难题,至少在目前,朋友们根本不要奢望能够通过类

HBase表数据分页处理

HBase表数据分页处理 HBase是Hadoop大数据生态技术圈中的一项关键技术,是一种用于分布式存储大数据的列式数据库,关于HBase更加详细的介绍和技术细节,朋友们可以在网络上进行搜寻,笔者本人在接下来的日子里也会写一个HBase方面的技术专题,有兴趣的朋友们可以稍微的期待一下.不过本章节的重点是介绍下HBase表数据的分页处理,其他的就不多说了. 首先说一下表数据分页中不可回避的一个指标:总记录数.在关系数据库中很容易统计出记录总数,但在HBase中,这却是一个大难题,至少在目前,朋友们

21.5 memcached命令行;21.6 memcached数据导出和导入;21.7 php连接

21.5 memcached命令行 Memcached语法规则: 1. <command name> <key> <flags> <exptime> <bytes>\r\n <data block>\r\n 注:\r\n在windows下是Enter键 2. <command name> 可以是set, add, replace 3. set表示按照相应的<key>存储该数据,没有的时候增加,有的时候覆盖 4.

memcached命令行以及数据导出和导入、 php连接memcached以及储到sessions

memcached命令行 进入到memcached中,如果没有可以yum安装telnet 127.0.0.1 11211Trying 127.0.0.1...Connected to 127.0.0.1.Escape character is '^]'.set key2 0 30 2set:是用来储存数据的key:这里面key2是key的名字,因为memcached是属于key- valux,存数据要有一个key,也要有一个valux.2:这里面的2是你要存到数值是两位的,或者是两个字节.比如我

MongoDB数据导出、导入及索引建立

(1)    数据导出--每个表一个文件: # mongoexport --db project --collection 表名 --out 输出文件名,如: # mongoexport --db project --collectionstock --out stock.json,导出所有F10数据到文件/root/stock.json中 (2)    数据导入--每个表一个文件: # mongoimport --db users --collection 表名 --file输入文件名 (3)

oracle表的导出与导入

数据导出: 1 将数据库TEST完全导出,用户名system 密码manager 导出到D:\daochu.dmp中   exp system/[email protected] file=d:\daochu.dmp full=y 2 将数据库中system用户与sys用户的表导出   exp kjeccus/[email protected]KJTEST file=d:\daochu.dmp owner=(kjeccus,dbwork ) 1 将D:\daochu.dmp 中的数据导入 TES

MySQL数据导出与导入

发一篇基础的,关于MySQL数据导出导入的文章,目的有二: 1.备忘 2.供开发人员测试 工具 mysql/source 导入mysqldump 导出 应用举例 导出 导出全库备份到本地的目录 mysqldump -u$USER -p$PASSWD -h127.0.0.1 -P3306 --routines --default-character-set=utf8 --lock-all-tables --add-drop-database -A > db.all.sql 导出指定库到本地的目录(

oracle数据库数据导出和导入

oracle的客户端里面的bin下面有两个可执行文件,名称分别为exp.exe和imp.exe. 他俩的用途就是导出和导入数据用的. 全库 导出:exp 用户名/密码@数据库名 full=y file=c:xxxx.dmp owner=数据库用户 导入:imp 用户名/密码@数据库名 full=y file=c:xxxx.dmp owner=数据库用户 单表 导出:exp 用户名/密码@数据库名 grants=y tables=table_name file=c:xxx.dmp owner=数据