HBase表的备份

HBase表备份其实就是先将Table导出，再导入两个过程。

导出过程

//hbase org.apache.hadoop.hbase.mapreduce.Driver export 表名数据文件位置
//数据文件位置：可以是本地文件目录,也可以是hdfs路径
//当其为前者时,必须加上前缀file://
//当其为后者时,可以直接指定 "/root/test/users",也可以写路径 "hdfs://hadoop01:9000/root/test/users"
//另外,该接口类还提供了一些其它的方法。例如表与表之间的数据拷贝，导入tsv文件(一种数据间以制表符分割的文件)等
//如果"/root/test/users/" 目录已存在则会报错。【表名不用添加引号】

[[email protected] conf]# hbase org.apache.hadoop.hbase.mapreduce.Driver export users file:///root/test/users

注意：这是一个没有reduce的MR过程，从产生的结果文件"/root/test/users/part-m-00000" 可以看出。

导入过程
//hbase org.apache.hadoop.hbase.mapreduce.Driver import 表名数据文件位置
//数据文件位置：可为本地文件目录，也可以为hdfs的路径。
//当其为前者时,必须加上前缀file://
//当其为后者时,可以直接指定 "/root/test/users",也可以写路径 "hdfs://hadoop01:9000/root/test/users"
//新的表必须存在，否则报错
//如果导出的数据很多，导入的时候千万不要把所有的part-m-0000*文件都放到一个目录下开始导入，肯定会失败的！
//应该将part-m-0000*文件一个个开始导入。

[[email protected] conf]# hbase org.apache.hadoop.hbase.mapreduce.Driver import bak file:///root/test/users

时间： 2024-11-08 18:56:34

HBase表的备份的相关文章

HBase中的备份和故障恢复方法

在这篇文章中,你将会对在HBase中可用的数据备份机制有一个高层次的简要了解,并且知道多种数据恢复/容灾机制.在阅读了这篇文章之后,你应该能对你的业务需要那种BDR策略有了自己的判断.你也应该明白各种机制各自的优缺点(适用于CDH 4.3.0/HBase 0.94.6及更高版本). 备份 HBase是一个基于LSM树(log-structured merge-tree)的分布式数据存储系统,它使用复杂的内部机制确保数据准确性.一致性.多版本等.因此,你如何获取数十个region server在H

HBase表管理系统

1. 软件版本 & 部署: maven:3.3.9,jdk:1.7 ,Struts2:2.3.24.1,Hibernate:4.3.6,Spring:4.2.5,MySQL:5.1.34,Junit:4,Myeclipse:2014: Hadoop2.6.4,HBase1.1.2 源码下载:https://github.com/fansy1990/ssh_v3/releases 部署参考:http://blog.csdn.net/fansy1990/article/details/5135658

使用MapReduce查询Hbase表指定列簇的全部数据输入到HDFS（一）

package com.bank.service; import java.io.IOException; import org.apache.hadoop.conf.Configuration;import org.apache.hadoop.conf.Configured;import org.apache.hadoop.fs.Path;import org.apache.hadoop.hbase.HBaseConfiguration;import org.apache.hadoop.hba

HBase表数据导出和导入

本文不是技术收集贴,就是记录一下,因此没有收集所有的HBase表导入导出方式,只是记录一下自己用过的一种. 数据表的导出: 1 $ bin/hbase org.apache.hadoop.hbase.mapreduce.Driver export <tablename> <outputdir> [<versions> [<starttime> [<endtime>]]] 需要注意的是,outputdir指的是HDFS上的路径,建议使用绝对路径(没

Linux命令：MySQL系列之十三--MySQL备份与还原(针对单张表SELECT备份)

对于只备份单张表的备份与还原,通过SELECT命令,可以更快速的达到备份和恢复的目的: 以及通过此方法把一个数据库中表的数据,导入至另一数据库的表中去. 备份格式:SELECT * INTO OUTFILE '/PATH/TO/somefile.txt' FROM table_name [WHERE CLAUSE]; #备份table_name表中的[或者备份满足WHERE语句的数据]数据至服务器上保存. 注释:table_name:需要备份的表 WHERE:满足的条件,可选项. /PATH/

HBase表设计

1.Column Family 由于Hbase是一个面向列族的存储器,调优和存储都是在列族这个层次上进行的,最好使列族成员都有相同的"访问模式(access pattern)"和大小特征. 在一张表里不要定义太多的column family.目前Hbase并不能很好的处理超过2~3个column family的表.因为某个column family在flush的时候,它邻近的column family也会因关联效应被触发flush,最终导致系统产生更多的I/O. 2.Row Key 1

linux mysql 数据按表名称备份

1.按表名称备份 #!/bin/bash #user #数据库用户 dbuser="root" #数据库密码 dbpassword="chenyong" #时间 date=$(date +%Y%m%d) #数据库名称 dbname=sungrowv3 #备份数据保存的路劲 url=/home/test/sql/ #指定数据库的所以表 tables=$(mysql -u$dbuser -p$dbpassword -ss -e "use $dbname;sho

利用BulkLoad导入Hbase表

1.插入HBase表传统方法具有什么问题? 我们先看下 HBase 的写流程: 通常 MapReduce 在写HBase时使用的是TableOutputFormat方式,在map/reduce中直接生成put对象写入HBase,该方式在大量数据写入时效率低下,因为HBase会block写入,频繁进行flush.split.compact等大量IO操作,这样对HBase节点的稳定性也会造成一定的影响,例如GC时间过长,响应变慢,导致节点超时退出,并引起一系列连锁反应,而HBase支持BulkLoa

配置文件和配置表定期备份小工具

现在维护的配置文件/表都是人手工备份,上次某机器宕机,想在别的机器上拉起应用,去找备份的时候,发现最近的备份还是去年的,因此有了这个想法写这么一个小工具才进行定期备份.其实细极思恐,每天备份一下还是很有必要的,出事了,也能找到是哪天开始的不是? 设计的思路还是先把哪些机器的文件.哪个数据库的表需要备份,放入数据库中,然后弄一个shell,在某个机器上启动这个shell,使用ftp去备份配置文件,使用exp去dmp数据库文件,完成备份. 首先是数据库设计部分,需要两张表: "机器表":

猜你喜欢

CentOS系统启动及内核大破坏模拟实验

讲过了centos的启动流程,此时是不是想来点破坏呢?那就尽情的玩耍吧,记得在实验之前拍个快照,万一哪个环节错误恢复不回来了呢,毕竟数据无价,话不多说,开始. 一.删除伪系统根.(ramdisk文件) ...

使用find命令查找Linux中的隐藏文件的方法

我们可以在Linux 或者 Unix 系统上使用 find 命令去查询所有(全部)隐藏文件基本语法如下: 复制代码代码如下: [[email protected] ~]#find /要查找的文/件 ...

有关于静态方法的一点了解

一.printArray(); 1.字面意思:打印阵列: 2.在java中是直接引用printarray()方法: 3.在直接引用时,首先要创建方法private static void prin ...

Android:Otto源码分析

Otto源码分析 Otto是一个轻量级的EventBus,它的使用非常简单,我们使用一个Bus的单例,所有需要产生事件(@Produce bus.post(new YourEvent(-)))或者处理 ...

JS 16进制加密解密

http://www.zc520.cc/js/62.html <script type="text/javascript"> function JavaDe(){ va ...

Linux作业4

作业4:一.通配符练习: 1.显示/etc目录下,以字母开头,后面跟了一个非字母及其它任意长度任意字符的文件或目录: [[email protected] fuboyuan]# ls -l /etc/ ...

iOSDay37数据处理之CoreData

1. CoreData数据库框架的优势 1> CoreData历史 CoreData数据持久化框架是Cocoa API 的一部分,首次在iOS5版本的系统中出现,它允许按照实体-属性-值模型组织 ...

一步一步搭建LVS-DR模型LB集群(二)

LVS的持久连接: 持久连接即是不考虑LVS的转发方法,确保所有来自同一个用户的连接转发到同一个RealServer上 -p //表示此连接为持久连接 N //表示维持此持久连接的时间.默认6分钟 ...

往自动化测试方向前进

这几年随着互联网新产品的不断兴起,人们对于软件质量,用户体验越来越看重: 自然而然对于软件测试工程师的岗位需求与必备技能要求越来越高,许多做测试的小伙伴信心满满的投入到测试行业中. 日复一日做黑盒测试 ...

Linux账号和权限管理命令

Linux用户帐号分为: 超级用户 root (uid 0) 普通用户 (uid 500及以上) 程序用户 (uid 1-499) 组帐号: 基本组(私有组) 附加组(公共组) /etc/passw ...

[五]SpringBoot 之连接数据库(JPA-Hibernate)

在具体介绍之前,先了解下什么是JPA JPA全称JavaPersistence API.JPA通过JDK5.0注解或XML描述对象-关系表的映射关系,并将运行期的实体对象持久化到数据库中. http: ...

JS里面利用random（）实现随机颜色更换

首先你需要一个div <div id="box"></div> 然后给这个div加入CSS属性 #box{width:500px;height:500px; ...

记录一下JS正则的坑

JS正则的单行模式有点问题总之 . 符号匹配换行符号会有问题暂时的解决方案是 html = html.replace(/[\r\n]/g,""); 附加一个 html = ht ...

springmvc实现ajax的问题

使用springmvc实现ajax,遇到很多问题,记录几个比较常见的: 1:没有在Controller类中,对应的ajax方法上添加@ResponseBody,这个必须添加,否则返回值到不了页面上,j ...

空间单身公害独守空房据i文人雅士的风景将客户

http://www.xiami.com/g/thread-10304007http://www.xiami.com/g/thread-10304008http://www.xiami.com/g/t ...

参考文章: 1.用Unity做游戏,你需要深入了解一下IL2CPP(一) 2.IL2CPP 深入讲解:代码生成之旅(二) 3.IL2CPP 深入讲解:P/Invoke封装(三) 4.IL2CPP 深入 ...

为speedphp最新版添加仿Yii 的简易版数据验证支持不同场景，自定义回调

给个意见或建议吧扩展一个Model基类 <?php class BaseModel extends Model{ use ValidationRules; public function ru ...

让我们聊聊接口设计这件事情

万事皆有因这次换个大号一点的字体,因为后面会讲很多乱七八糟的事情.在自己公司做业务和帮朋友们解决问题的时候,问题都出在接口方面.很多时候Java的SOA的治理方案都会选择透明代理这种模式(例如dub ...

shell的单、多、控制进程

shell的单.多.控制进程的使用方法一.100个任务使用200秒(普通完成) cat process2.sh #!/bin/bash function aaa () { start=`dat ...

数据结构与算法2-4 堆栈链式存储

链表中,只有一端进行插入与删除在表头的位置,以避免需要知道实际数据长度结构: typedef struct Node() { ElementType data; struct node *Next ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.036 s.