habse的CopyTable

需求：对hbase的一张表进行拷贝

一、table1的内容如下

hbase(main):018:0> scan ‘table1‘
ROW                                              COLUMN+CELL
 1                                               column=f1:age, timestamp=1469069255119, value=10
 1                                               column=f1:gender, timestamp=1469069255119, value=male
 1                                               column=f1:name, timestamp=1469069255119, value=zhangsan
 2                                               column=f1:name, timestamp=1469069255119, value=lisi
 3                                               column=f1:name, timestamp=1469069255119, value=wangwu
 4                                               column=f1:birthday, timestamp=1469069255119, value=1993
 4                                               column=f1:name, timestamp=1469069255119, value=zhaoliu
4 row(s) in 0.0300 seconds

二、现在将table1拷贝

hbase org.apache.hadoop.hbase.mapreduce.CopyTable --new.name=table2 table1

三、scan table2中的数据

hbase(main):026:0> scan ‘table2‘
ROW                                              COLUMN+CELL
 1                                               column=f1:age, timestamp=1469069255119, value=10
 1                                               column=f1:gender, timestamp=1469069255119, value=male
 1                                               column=f1:name, timestamp=1469069255119, value=zhangsan
 2                                               column=f1:name, timestamp=1469069255119, value=lisi
 3                                               column=f1:name, timestamp=1469069255119, value=wangwu
 4                                               column=f1:birthday, timestamp=1469069255119, value=1993
 4                                               column=f1:name, timestamp=1469069255119, value=zhaoliu
4 row(s) in 0.0260 seconds

时间： 2024-12-21 23:53:07

habse的CopyTable的相关文章

使用CopyTable工具方法在线备份HBase表

CopyTable is a simple Apache HBase utility that, unsurprisingly, can be used for copying individual tables within an HBase cluster or from one HBase cluster to another. In this blog post, we'll talk about what this tool is, why you would want to use

HBase备份之ExportSnapshot或CopyTable

文章<HBase备份之导入导出>介绍了使用HBase的自带工具Export和Import来实现在主集群和从集群之间拷贝表的目的.本篇介绍一种相比导入导出而言,更快速的一种备份办法.即ExportSnapshot. 1.ExportSnapshot 和Export类似,ExportSnapshot也是使用MapReduce方式来进行表的拷贝.不过和Export不同,ExportSnapshot导出的是表的快照.我们可以使用ExportSnapshot将表的快照数据先导出到从集群,然后再从集群中使

hbase copyTable

参考:https://yq.aliyun.com/articles/176546 执行:hbase org.apache.hadoop.hbase.mapreduce.CopyTable --new.name="default:cheat.20180501_superid_ua_analysis" "cheat:20180501_superid_ua_analysis" 异常:Caused by: java.lang.ClassNotFoundException:

habse java api使用操作

上一篇cm5.4和cdh5.4安装(http://my.oschina.net/penngo/blog/517223),本文使用HBase的java客户端api操作Hbase. 需要用到的包可以在/opt/cloudera/parcels/CDH-5.4.7-1.cdh5.4.7.p0.3/jars找到,hbase版本1.0.0 HbaseTest3.java代码例子 import java.io.IOException; import org.apache.hadoop.conf.Config

Hbase学习（五）-hbase常识及habse适合什么场景

当我们对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用使用什么数据库?答案是什么,如果我们使用的传统数据库,肯定留有多余的字段,10个不行,20个,但是这个严重影响了质量.并且如果面对大数据库,pt级别的数据,这种浪费更是严重的,那么我们该使用是什么数据库?hbase数个不错的选择,那么我们对于hbase还存在下列问题: 1.Column Family代表什么? 2.HBase通过row和column确定一份数据,这份数据的值可能有多个版本,为什么会存在多个版本? 3.查询

Hbase总结（五）-hbase常识及habse适合什么场景

当我们对于数据结构字段不够确定或杂乱无章非常难按一个概念去进行抽取的数据适合用使用什么数据库?答案是什么,假设我们使用的传统数据库,肯定留有多余的字段.10个不行,20个,可是这个严重影响了质量. 而且假设面对大数据库,pt级别的数据,这样的浪费更是严重的,那么我们该使用是什么数据库?hbase数个不错的选择,那么我们对于hbase还存在下列问题: 1.Column Family代表什么? 2.HBase通过row和column确定一份数据,这份数据的值可能有多个版本号,为什么会存在多个版本号?

HABSE表结构理解

也分为行列,行是索引,锁定数据,查找数据只能通过行列:建表时必须知道列族,真实列(列簇)在插入数据时候可以指定查找指定列,必须带列族,列族1:name

habse入门级别的笔记（摘抄）

最最常用的指令: 1.查看hbase有什么表 list 2.创建一个表: create '表名', '字段1', '字段二',... 3.往表中插入一条数据:put '表名','rowkey','字段一:','字段一栏目一名称','字段一栏目一',..... 4.查看整个表某列的内容:scan '表名','行名称','列名称' 5.获得某行记录:get '表名','rowkey' 6.查看表中记录总数:count '表名' 调用hbase接口应该注什么? 1.初始化配置(如): Configur

hbase常识及habse适合什么场景

当我们对于数据结构字段不够确定或杂乱无章很难按一个概念去进行抽取的数据适合用使用什么数据库?答案是什么,如果我们使用的传统数据库,肯定留有多余的字段,10个不行,20个,但是这个严重影响了质量.并且如果面对大数据库,pt级别的数据,这种浪费更是严重的,那么我们该使用是什么数据库?hbase数个不错的选择,那么我们对于hbase还存在下列问题: 1.Column Family代表什么?2.HBase通过row和column确定一份数据,这份数据的值可能有多个版本,为什么会存在多个版本?3.查询的时