hive跨集群迁移表

一、原集群操作：

1、hdfs创建目录
hdfs dfs -mkdir /tmp/hive-export

2、hive导出表命令
hive -e "use 库;show tables" | awk ‘{printf "use 库;export table %s to @/tmp/hive-export/%[email protected];\n",$1,$1}‘ | sed "s/@/‘/g" > export.sql

3、报错
return code -101 from org.apache.hadoop.hive.ql.exec.copytask org/apache/hadoop/tools/distcpoptions
使用 -hiveconf hive.root.logger=DEBUG,console 参数打印错误信息，有如下内容：
java.lang.NoClassDefFoundError: org/apache/hadoop/tools/DistCpOptions

4、原因
hive 最后移动数据的时候，需要调用hadoop-distcp-X.X.X.jar,
解决方法：只需要把$HADOOP_HOME/share/hadoop/tools/lib/hadoop-distcp-x.x.x.jar 拷贝到 $HIVE_HOME/lib下面，重启hive即可

5、继续执行2命令

6、hive导出数据到hdfs
hive -f export.sql

二、新集群操作

1、hdfs创建目录
hdfs dfs -mkdir /tmp/hive-export

2、将hdfs数据导入到新集群
hadoop distcp hdfs://原/tmp/hive-export/* /tmp/hive-export

3、修改export.sql
sed -i ‘s/export table/import table/g‘ export.sql
sed -i ‘s/ to / from /g‘ export.sql

4、执行导入还会报错，按照之前解决方法解决

5、hive导入
hive -f export.sql

原文地址：https://www.cnblogs.com/water-sky/p/11889820.html

时间： 2024-11-11 23:04:49

hive跨集群迁移表的相关文章

使用SCVMM跨集群迁移虚拟机失败(2904)

最近为客户部署了一个测试Hyper-V集群,其希望从原来的Hyper-V集群中将某些测试的虚拟机迁移到新部署的测试集群中,两个集群采用的Hyper-V版本均为Windows Server 2012.两个集群采用同一个SCVMM进行管理. 问题现象在迁移某些虚拟机的时候,SCVMM提示了ID为2904的错误.错误详细信息为"VMM在XXX服务器上找不到指定的路径C:\ClusterStorage\Volume1\虚拟机名称\Virtual Hard Disks\.系统找不到指定的路径.(0x

Kafka跨集群迁移方案MirrorMaker原理、使用以及性能调优实践

序言Kakfa MirrorMaker是Kafka 官方提供的跨数据中心的流数据同步方案.其实现原理,其实就是通过从Source Cluster消费消息然后将消息生产到Target Cluster,即普通的消息生产和消费.用户只要通过简单的consumer配置和producer配置,然后启动Mirror,就可以实现准实时的数据同步. 1. Kafka MirrorMaker基本特性Kafka Mirror的基本特性有: 在Target Cluster没有对应的Topic的时候,Kafka Mir

GaussDB 200跨集群访问HDFS

当需要从Hive等Hadoop集群迁移数据到GaussDB 200集群时,因为数据量太大,可能无法导出到本地.此时需要GaussDB 200跨集群读取HDFS上的数据,并写入GaussDB 200集群. 目前GaussDB 200只支持跨集群访问FusionInsight HD中的HDFS. 前提条件 FusionInsight HD和GaussDB 200两个集群状态正常并且可以互相通信. 远端FusionInsight HD集群被访问的表为ORC格式. 远端FusionInsight HD集

HDFS跨集群数据合并方案之ViewFileSystem

前言在很多时候,我们会碰到数据融合的需求,比如说原先有A集群,B集群,后来管理员认为有2套集群,数据访问不方便,于是设法将A,B集群融合为一个更大的集群,将他们的数据都放在同一套集群上.一种办法就是用Hadoop自带的DistCp工具,将数据进行跨集群的拷贝.当然这会带来很多的问题,如果数据量非常庞大的话.本文给大家介绍另外一种解决方案,ViewFileSystem,姑且可以叫做视图文件系统.大意就是让不同集群间维持视图逻辑上的唯一性,不同集群间还是各管各的. 传统数据合并方案为了形成对比,

GuassDB 200跨集群访问其他数据平台

本文分别介绍GuassDB跨集群访问远端oracle以及远端MPPDB数据库.因环境有限,这里不列举对接HDFS以及对接Spark功能. 一.对接oracle数据库 1.约束限制仅支持连接Oracle11.2.0.1至Oracle12.2.0.1. 要求Oracle-ODBC驱动的版本为12.2.0.1.0. unixODBC的版本要求为2.3.6. 支持最多配置20组远端Oracle配置. 配置所需要的Oracle ODBC请从Oracle官网下载.以配置访问Oracle11.2.0.4为例

cdh5+hive+zookeeper集群环境搭建

环境 1.centos6.5(64位) 机器规划及节点分布主机角色节点节点节点节点节点 192.168.115.132 master namenode journalnode zk hive 192.168.115.133 slave1 namenode datanode journalnode zk hive 192.168.115.134 slave2 datanode journalnode zk 目录设置 dfs.namenode.name.dir = file

MySQL集群数据库表的主键设计

使用MySQL数据库的人,毫无例外的在设计时都会碰到主键的选型,一般都会在下面三种中选择一个或多个,自增长列.UUID以及UUID_SHORT,这集中主键的特性,想必大家都非常了解了,我就不再细说了,在InnoDB引擎中,选择哪种主键更好,网上也有很多帖子有描述,基本上都是建议是自增长列或者搭配UUID作为逻辑主键一起使用,但是如果是ndbcluster引擎呢? 为此我专门做了一下测试,环境为4台物流机器(2C,8G内存)做的数据节点,NoOfReplicas=2,首先建立三张表. CREATE

Oracle数据库集群添加表空间操作规范

1.首先检查dg空间是否充足SQL> select name,total_mb,free_mb,USABLE_FILE_MB from v$asm_diskgroup; NAME TOTAL_MB FREE_MB USABLE_FILE_MB --------------------------------- ---------- ---------- -------------- DATADG

王家林的云计算分布式大数据Hadoop征服之旅：HDFS&MapReduce&HBase&Hive&集群管理

一:课程简介: 作为云计算实现规范和实施标准的Hadoop恰逢其时的应运而生,使用Hadoop用户可以在不了解分布式底层细节的情况下开发出分布式程序,从而可以使用众多廉价的计算设备的集群的威力来高速的运算和存储,而且Hadoop的运算和存储是可靠的.高效,的.可伸缩的,能够使用普通的社区服务器出来PB级别的数据,是分布式大数据处理的存储的理想选择. 本课程会助你深入浅出的掌握Hadoop开发(包括HDFS.MapReduce.HBase.Hive等),并且在此基础上掌握Hadoop集群的配置.维

猜你喜欢

Oracle 基本SQL SELECT语句

SELECT * | { [ DISTINCT ] column | expression [ alias ] , ... } FROM ta ...

Linux学习笔记二

((((((((((((((((谦(装)虚(逼)起始线))))))))))))))) -------------------------------------------------list命令-- ...

pod install 慢

最近使用CocoaPods来添加第三方类库,无论是执行pod install还是pod update都卡在了Analyzing dependencies不动原因在于当执行以上两个命令的时候会升级Co ...

nimghjfdsaqwedsx

www.techbang.com/users/q0o8u0u0.2015-01-03www.techbang.com/users/c6a6k6e6.2015-01-03www.techbang.com ...

php对mysql简单读取的实例

读取mysql数据库例. 代码如下复制代码 <?php $link=mysql_connect("localhost","root","之前 ...

Toll-Free Bridging 对象桥接(Xcode文档翻译)

译者序: 带学生看Xcode API 文档的时候,总有学生被通篇的英文搞晕,并询问是否有中文版. 初步搜索和询问的结果是,中文版有但是很少.(如果知道哪里有,希望能够分享一下这个信息) 于是决心从今天 ...

常用http请求状态码含义

1** ----临时响应 2** ----成功响应 3** ----重定向 4** ----请求错误 5** ----服务器错误常用的几个如下: 200---服务器成功返回网页 301-- ...

nodjs 多线程之主从模式

##work.js let http = require('http'); let port = Math.round((1+Math.random())*1000);http.createServe ...

华为实习日记——第二十三天

最近几天的天气比较凉爽,早晨走在路上吹着清凉清凉的风,感觉很舒服. 上午没任务,就把cinder-volume的创建卷的过程过了一遍,记了下笔记. 下午的时候很无聊,师父要开一天会,没人给我任务.就一 ...

linux--redis的安装和配置和开启多个端口

在workerman开发过程中需要安装redis来存储用户ip.端口等信息首先UBUNTU中安装redis: apt-update //更新apt包源apt-get install redis-s ...

lseek()有个特殊的用途,确定文件是常规文件还是设备.<pre lang="c" escaped="true">off_t currpos;ou ...

延迟着色

今天我们来讨论一下游戏中多光源的应用,为了有更好的光照效果,引擎就必须对多光源进行支持.实现方式大致有以下几种: 1.传统的前身渲染(Forward rendering). 这个一般在国内的游戏引擎中 ...

邻接表模板

l邻接表的处理方法是这样: l图中顶点用一个一维数组存储,当然,顶点也可以用单链表来存储,不过数组可以较容易地读取顶点信息,更加方便. l图中每个顶点Vi的所有邻接点构成一个线性表,由于邻接点的个数不 ...

SQL 更新时间字段的年份

; color:rgb(51,51,51); font-family:Arial,Console,Verdana,'Courier New'"> --修改d表日期字段的年份 updat ...

Mysql乱码问题总结

这两天研究了下Mysql的字符集编码和排序规则,有个很典型的问题就是乱码问题.所以小记一下. http://www.jianshu.com/p/4c6a27542df4 http://blog.csd ...

51nod 1161 Partial Sums,1172 Partial Sums V2

这两题原理是一样的,不过第二题数据量大一些.这个累加操作相当于一个矩阵乘法,然后用矩阵中的第一列数和输入的数组做卷积,比如这个样例处理2次矩阵就是这样的然后取出第一列数和输入的数做卷积,也就是多项式 ...

逻辑思维“战术与战略”

所谓的战术是种终点式的思维.而战略则是里程碑式的思维.后者加入了时间.变化的考量,提升了一个纬度,不得不说是种更为高级的智慧战略和战术之间到底是啥区别? 分三个层次讲战略和战术的区别: 第一个层次的 ...

【CodeForces】835D Palindromic characteristics

[算法]区间DP [题解]涉及回文问题的区间DP都可以用类似的写法,就是h[i][j]表示i~j是否回文,然后就可以O(1)判断回文了. f[i][j]=k表示该字符串是k-th字符串,因为首先要求回 ...

图解CSS3制作圆环形进度条的实例教程

圆环形进度条制作的基本思想还是画出基本的弧线图形,然后CSS3中我们可以控制其旋转来串联基本图形,制造出部分消失的效果,下面就来带大家学习图解CSS3制作圆环形进度条的实例教程首先,当有人说你能不能 ...

2015 年第七届全国大学生数学竞赛江西赛区获奖名单(数学专业)

姓名性别赛区学校名称所学专业参赛类型获奖等级廖登传男江西省东华理工大学数学与应用数学数学专业一等奖马士飞男江西省东华理工大学数学与应用数学数学专业一等奖聂鹏 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.029 s.