数据仓库Hive数据导入导出

Hive库数据导入导出

1、新建表data

hive (ebank)> create table data(id int,name string)

> ROW FORMAT DELIMITED

> FIELDS TERMINATED BY‘\t‘

> stored as textfile;

Time taken: 0.257 seconds

2、向data表中插入数据

hive (ebank)> load data local inpath ‘/home/hive/data.txt‘ overwrite into table data;

Loading data to table ebank.data

Table ebank.data stats: [numFiles=1, numRows=0, totalSize=33, rawDataSize=0]

Time taken: 0.909 seconds

3、查询表中数据

hive (ebank)> select * from data;

data.id data.name

101 张三

102 李四

103 王五

Time taken: 0.092 seconds, Fetched: 3 row(s)

4、表中数据落地

[[email protected] result]$ hive -e "select * from ebank.data" >> /home/hive/result/data.txt

Logging initialized using configuration in file:/etc/hive/2.5.3.0-37/0/hive-log4j.properties

Time taken: 1.283 seconds, Fetched: 3 row(s)

5、查看落地的数据

[[email protected] result]$ head data.txt

data.id data.name

101 张三

102 李四

103 王五

6、新建一张和data相同表结构的表data002

hive (ebank)> create table data002 like data;

Time taken: 5.533 seconds

7、查看新建表结构

hive (ebank)> desc data002;

col_name data_type comment

id int

name string

Time taken: 1.298 seconds, Fetched: 2 row(s)

8、落地的数据文件再次入表

hive (ebank)> load data local inpath ‘/home/hive/result/data.txt‘ overwrite into table data002;

Loading data to table ebank.data002

Table ebank.data002 stats: [numFiles=1, numRows=0, totalSize=51, rawDataSize=0]

Time taken: 39.613 seconds

9、查看新表中数据

hive (ebank)> select * from data002;

data002.id data002.name

NULL data.name------------>(这一行为原表表头)

101 张三

102 李四

103 王五

Time taken: 3.874 seconds, Fetched: 4 row(s)

时间： 2024-10-29 18:18:23

数据仓库Hive数据导入导出的相关文章

Hive 实战(1)--hive数据导入/导出基础

前沿: Hive也采用类SQL的语法, 但其作为数据仓库, 与面向OLTP的传统关系型数据库(Mysql/Oracle)有着天然的差别. 它用于离线的数据计算分析, 而不追求高并发/低延时的应用场景. 最显著的特别是, Hive的数据是Schema On Read, 对数据的写入非常的自由和松散, 而对数据的读取则作了各种限制. 而RMDBS则是Schema On Write, 对数据写入限制非常的严苛. *). 数据导入/导出让我们体验以下Hive中数据如何导入: 1). 创建数据库 db_

【源】从零自学Hadoop(16)：Hive数据导入导出，集群数据迁移上

阅读目录序导入文件到Hive 将其他表的查询结果导入表动态分区插入将SQL语句的值插入到表中模拟数据文件下载系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序上一篇,我们介绍了Hive的表操作做了简单的描述和实践.在实际使用中,可能会存在数据的导入导出,虽然可以使用sqoop等工具进行关系型数据导入导出操作,但有的时候只需要很简便的方式进行导入导出即可下面我们开始

如何利用sqoop将hive数据导入导出数据到mysql

运行环境 centos 5.6 hadoop hive sqoop是让hadoop技术支持的clouder公司开发的一个在关系数据库和hdfs,hive之间数据导入导出的一个工具. 上海尚学堂hadoop大数据培训组原创,陆续有hadoop大数据技术相关文章奉上,请多关注! 在使用过程中可能遇到的问题: sqoop依赖zookeeper,所以必须配置ZOOKEEPER_HOME到环境变量中. sqoop-1.2.0-CDH3B4依赖hadoop-core-0.20.2-CDH3B4.ja

【源】从零自学Hadoop(17)：Hive数据导入导出，集群数据迁移下

阅读目录序将查询的结果写入文件系统集群数据迁移一集群数据迁移二系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序上一篇,我们介绍了Hive的数据多种方式导入,这样我们的Hive就有了数据来源了,但有时候我们可能需要纯粹的导出,或者集群Hive数据的迁移(不同集群,不同版本),我们就可以通过这两章的知识来实现. 下面我们开始介绍hive的数据导出,以及集群Hive数据的

Hive数据导入导出

一. 从文件系统导入数据源存放路径: /root/data hive> load data local inpath "/root/data" overwrite intotable t1; Loading data to table default.t1Table default.t1 stats: [numFiles=1, numRows=0, totalSize=30,rawDataSize=0]OKTime taken: 1.712 secondshive>

HData——ETL 数据导入/导出工具

HData是一个异构的ETL数据导入/导出工具,致力于使用一个工具解决不同数据源(JDBC.Hive.HDFS.HBase.MongoDB.FTP.Http.CSV.Excel.Kafka等)之间数据交换的问题.HData在设计上同时参考了开源的Sqoop.DataX,却与之有不同的实现.HData采用“框架+插件”的结构,具有较好的扩展性,框架相当于数据缓冲区,插件则为访问不同的数据源提供实现. [HData特性] 1.异构数据源之间高速数据传输: 2.跨平台独立运行: 3.数据传输过程全内存

Sqoop -- 用于Hadoop与关系数据库间数据导入导出工作的工具

转:https://blog.csdn.net/qx12306/article/details/67014096 Sqoop是一款开源的工具,主要用于在Hadoop相关存储(HDFS.Hive.HBase)与传统关系数据库(MySql.Oracle等)间进行数据传递工作.Sqoop最早是作为Hadoop的一个第三方模块存在,后来被独立成为了一个Apache项目.除了关系数据库外,对于某些NoSQL数据库,Sqoop也提供了连接器. 一.Sqoop基础知识 Sqoop项目开始于2009年,可以在H

Oracle数据导入导出基本操作示例

Oracle数据导入导出基本操作示例数据导出 a.将数据库orcl完全导出,用户名user 密码password 导出到D:\dc.dmp中 exp user/[email protected] file=d:\dc.dmp full=y full=y 表示全库导出 b.将数据库中user1和user2用户导出 exp user/[email protected] file=d:\dc.dmp owner=(user1,user2) full方式可以备份所有用户的数据库对

考试系统维护--不同版本SQL数据导入导出

考试系统维护过程中,为了保证考试的顺利进行需要在多个服务器上搭建考试系统(备份),这时候需要把数据库来回迁移,之前我们常用的数据库备份还原的方法确实简单方便,但是遇到不同的服务器安装的SQL版本不同就歇菜了,虽然当时为了以后操作方便,我们把这次要用的服务器的数据库版本都统一了,但是在考试系统维护中米老师让我感触最深的一点-----"凡事多想一点!"多思考必须要应用到实际,所以我回来又仔细研究了几种不同版本SQL数据导入导出的方法,与大家交流提高. 一:使用SQLServer Impor