hive导入导出数据案例

查询数据：

use ods;set /user.password=ODS-SH;select * from base_cdma_all limit 10;

use tag_bonc;select * from dpi_http_userapp_statistics limit 100000;

#设置显示当前使用的数据库

set hive.cli.print.current.db=true;

#设置不优先使用MapReduce

set hive.exec.mode.local.auto=true;

======================导出数据=============================

#导出hive数据到本地(事先要建好目录)

use myexec;

insert overwrite local directory ‘/home/hadoop/res‘

row format delimited

fields terminated by ‘\t‘

select column1,column2 from table1;

#不显式指定分隔符将会以默认的分隔符来分割列

use myexec;

insert overwrite local directory ‘/home/hadoop/res‘

select * from table1;

#导出hive数据到HDFS(不要事先建好目录)

use myexec;

insert overwrite directory ‘/hive_data_to_hdfs‘

select * from table1;

#导出到Hive的另一个表中

use myexec;

insert into table2

row format delimited

fields terminated by ‘\t‘

select * from table1;

#用hive的-e和-f参数来导出数据。其中-e 表示后面直接接带双引号的sql语句；而-f是接一个文件(文件的内容为一个sql语句)

hive -e "use myexec;select * from table1" >> /home/hadoop/res/data1.txt

#这种方式不会启用MapReduce

hive -f mytest.hql >> /home/hadoop/res.txt

其中mytest.hql内容为:

use myexec;

select * from table1;

=====================导入数据==========================

外部表、内部表都可以分别加载本地和HDFS上的数据,创建表时最好指定列分隔符

内部表如果使用load data命令,都是把hdfs上的数据(如果是本地数据则先上传到HDFS)移动(剪切)到数据仓库所在目录

外部表如果在创建时指定了存放数据的路径,则在load data时数据是被移动到创建表时指定的目录,否则同上

两者的主要区别是:

外部表建表的同时指定hdfs路径，在数据拷贝到指定hdfs路径的同时，也同时完成数据插入external表(只是保持映射关系),此时数据没有被移动(数据仓库里没有显式存放该数据)

删除内部表会把数据一起删除,而删除外部表则只是使得在hive下查询不到此表(元数据被删了),数据本身没有被删除,依然存在相应的数据仓库目录下

#修改存储路径

alter table table1

set location ‘hdfs://172.16.122.200:8020/data/datatest.txt‘;

#创建外部表时指定位置(在数据拷贝到指定hdfs路径的同时,数据插入该external表)

#这种方式常常用于当hdfs上有一些历史数据,而我们需要在这些数据上做一些hive的操作时使用,这种方式避免了数据拷贝开销

CREATE EXTERNAL TABLE MYTEST(num INT, name STRING)

COMMENT ‘this is a test‘

ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t‘

STORED AS TEXTFILE

LOCATION ‘/data/test‘;

#创建一个测试用表(内部表)

CREATE TABLE MYTEST2(num INT, name STRING)

COMMENT ‘this is a test2‘

ROW FORMAT DELIMITED FIELDS TERMINATED BY ‘\t‘

STORED AS TEXTFILE;

1)数据不在hdfs上,直接从本地(local)导入hive表

这种方式导入的本地数据可以是一个文件,一个文件夹或者通配符,需要注意的是,如果是文件夹,文件夹内不能包含子目录,同样,通配符只能通配文件

LOAD DATA LOCAL INPATH ‘/home/work/test.txt‘ [OVERWRITE] INTO TABLE MYTEST2;

2)从hdfs导入数据

LOAD DATA INPATH ‘/data/test/test.txt‘ [OVERWRITE] INTO TABLE MYTEST2 [PARTITION (ds=‘2008-08-15‘)];

3)从其它表导入数据

FROM MYTEST3 test3

INSERT OVERWRITE TABLE MYTEST2

select test3.num where name=‘world‘;

4)在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中

create table test4

select id, name, tel

from wyp;

时间： 2024-10-05 14:55:05

hive导入导出数据案例的相关文章

mysql导入导出数据中文乱码解决方法小结

inux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqldump的时候需要加上--default-character-set=utf8, 例如下面的代码: 复制代码代码如下: mysqldump -uroot -p --default-character-set=utf8 dbname tablename > bak.sql 那么导入数据的时候也要使用--

Excel格式导入导出数据（单语言版本）

Excel格式导入导出数据(单语言版本) 可以使用常用的excel格式导入导出相关数据,包含: 1. 商品分类: 2. 筛选组: 3. 筛选: 4. 商品资料: 5. 商品附加图片资料,(不包含图片本身的上传或抓取): 6. 商品选项: 7. 商品属性: 8. 产品特价数据: 9. 商品折扣数据: 10. 商品奖励积分数据: 特色: 1. 常用excel软件编辑商品数据后导入: 2. 导出的文件名称包含日期和时间,便于备份存档: 3. 由于涉及到服务器的内存,以及数据的多寡,可以将数据按照商品I

常见SQL Server导入导出数据的几个工具

摘自:http://www.cnblogs.com/chenxizhang/archive/2011/06/09/2076542.html 在我们的日常工作中,与数据库打交道的机会越来越多.这一篇文章我整理一下常见的SQL Server导入导出数据的几个工具 1. 数据导入导出向导这是一个可视化的工具,我放在首位,是由于它可以极大灵活地满足导入导出功能,而且是所见即所得的,易于使用. 启动数据导入导出向导的方式有好多种,我自己习惯直接通过如下的命令启动(开始=>运行) dtswizard(顾名

（六）成批导入导出数据

(六) 成批导入导出数据假设已经存在teaching数据库, 存在一张Student表,如图: 右键teaching->任务->导入数据下一步->数据源(Microsoft Excel)->文件路径导入表->下一步(选择哪个数据库) 下一步->复制一个或多个表或视图的数据下一步->选择导入的表和导入到数据库的表,如图->编辑映射下一步: 源 --> 目标删除目标表中的行,原来表中数据被清除向目标表中追加行(选择该选项)->确定下一步

oracle中导入导出数据备份数据库

原文:oracle中导入导出数据备份数据库数据库所在位置将数据导出到的文件名用户名备份数据库 :exp csm/[email protected]/orcl file=c:/baoan_1.1.0_20120816.dmp owner=(csm) 数据库所在位置需要导入数据的文件名恢复数据库 :imp csm/[email protected]/orc

NPOI导入导出数据

//导入数据 protected void btnImport_Click(object sender, EventArgs e) { //判断fileImport控件中是否有需要上传的文件 if (this.fileImport.HasFile) { //判断文件类型是否符合要求 if (Path.GetExtension(this.fileImport.FileName) != ".xls") { MessageTips("上传的文件类型不符合要求", Me

解决mysql导入导出数据乱码问题

最近在linux上面用mysqldump导出数据,放在windows系统中导入就会出现中文乱码,然后就会导致出现: Unknown MySQL server host和Can't connect to the server的错误.解决mysql导入导出数据乱码问题就是统一导入导出的编码,linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqldump的时候需要加上--def

DOS 选项跳转实现、dos + bcp 双击导入导出数据

DOS 选项跳转实现.dos + bcp 双击导入导出数据 option.bat @echo off :Start2 cls goto Start :Start title Frequently Used Websites echo Please select a website from the list echo with the corresponding key echo -------------------------------------- echo [1] Google ech

[转]mysql导入导出数据中文乱码解决方法小结

本文章总结了mysql导入导出数据中文乱码解决方法,出现中文乱码一般情况是导入导入时编码的设置问题,我们只要把编码调整一致即可解决此方法,下面是搜索到的一些方法总结,方便需要的朋友. linux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqldump的时候需要加上--default-character-set=utf8, 例如下面的代码: 代码如下: mys