HIVE入门操作

1     
HIVE入门操作

1.1     
连接环境

输入 hive;进入hive环境

输入 quit;退出hive环境

1.2     
查看数据库

show databases;

1.3     
创建数据库

create database mng;

1.4     
链接数据库

use mng;

成功显示如下:

1.5     
查看表

show tables;

1.6     
创建表注意点

l  数据类型对比

NUMBER(14) -- BIGINT

NUMBER(m,n) – DOUBLE

VARCHAR2 -- STRING

NUMBER(1) -- TINYINT

l  表只保留一级分区;使用数据时间做分区

l  表分区保留多级分区

l  去掉default和not null声明

l  分区字段的数据不需要写入表文件


insert数据时,hive默认用\N表示null值,需要改变这个设置,使用‘‘表示null值

alter table tablename set serdeproperties(‘serialization.null.format‘ = ‘‘);

l  表存储设置有两种定义方式,推荐用方式2

表定义1:

create table TEST

(

cell_id      string,

user_cnt     bigint,

hcsv_cnt     bigint,

arpu         double,

call_dur_sum double,

sms_cnt_sum  bigint,

data_vol_sum double,

erl          double

)

partitioned by (data_date bigint)

row format delimited

fields terminated by ‘|‘

collection items terminated by ‘,‘

map keys terminated by ‘-‘

lines terminated by ‘\n‘;

alter table mng_av_in_m set serdeproperties(‘serialization.null.format‘ = ‘‘);

表定义2:

create table TEST

(

cell_id      string,

user_cnt     bigint,

hcsv_cnt     bigint,

arpu         double,

call_dur_sum double,

sms_cnt_sum  bigint,

data_vol_sum double,

erl          double

)

row format serde ‘org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe‘ with serdeproperties

(

‘escape.delim‘=‘//‘,

‘mapkey.delim‘=‘-‘,

‘serialization.format‘=‘|‘,

‘colelction.delim‘=‘,‘,

‘field.delim‘=‘|‘,

‘line.delim‘=‘\n‘,

‘serialization.null.format‘=‘‘

)

stored as textfile;

1.7     
测试数据导入表命令

load data local inpath ‘文件路径‘ overwrite into table TABLE_NAME partition (DATA_DATE=‘20130101000000‘);

备注:分区字段的数据不需要写入表文件

1.8     
查看表对应的目录和文件

desc formatted tablename;

1.9     
查看表对应的数据文件

dfs -ls 文件路径

1.10     
查看表文件中的数据

dfs –cat 文件路径

1.11     
truncate 分区

truncate table TABLE_NAME partition (sum_start_dttm=20131001000000);

1.12     
删除分区

ALTER TABLE 
TABLE_NAME  DROP PARTITION (sum_start_dttm = 20131001000000);

HIVE入门操作

时间: 2024-10-10 12:58:36

HIVE入门操作的相关文章

Hive入门笔记-----架构以及应用介绍

Hive这个框架在Hadoop的生态体系结构中占有及其重要的地位,在实际的业务当中用的也非常多,可以说Hadoop之所以这么流行在很大程度上是因为Hive的存在.那么Hive究竟是什么,为什么在Hadoop家族中占有这么重要的地位,本篇文章将围绕Hive的体系结构(架构).Hive的操作.Hive与Hbase的区别等对Hive进行全方面的阐述. 在此之前,先给大家介绍一个业务场景,让大家感受一下为什么Hive如此的受欢迎: 业务描述:统计业务表consumer.txt中北京的客户有多少位?下面是

HIVE入门

HIVE入门    $show databases;        执行后发现默认有一个库default    $show tables;        发现没有任何表,证明不use其他库时,默认就是default库.    $create database tedu;        发现在hdfs中多出了/user/hive/warehouse/tedu.db目录        结论1:hive中的数据库对应hdfs中/user/hive/warehouse目录下以.db结尾的目录.    $

Git入门操作

仅学习Git的一些入门操作比较容易,平时更多地使用GitHub,不过今天我想自个搭个服务练练手.当看完一些材料合作了一些验证之后,才发现其实所谓的服务和之前的svn完全不一样了.过程记录如下: LinuxServer端安装git 我把服务打在Linux机器上,这台破机器没有apt-get,没有yum,只好自己下载源码,自己编译 $ wget http://distfiles.macports.org/git/git-2.5.3.tar.gz $ tar xzvf git-latest.tar.g

git 入门操作指令

git add [commit file list] 将已经修改的代码添加索引 git commit -m [commit message] 将已经索引的代码修改提交至本地的库 git push origin [branch_name] 将分支 branch_name 的代码推送至服务器 git pull origin [branch_name] 获取分支 branch_name上的最新代码 git pull --rebase origin [branch_name] 将当前 branch 从

VS 2010 C#入门操作小技巧

*推荐C#入门教学视频(http://www.51xue8.com/e/DownSys/play/?classid=27&id=6719&pathid=3&jishu=17) VS 2010 C#入门操作小技巧 1.认识VS2010:阅读技术文档或者教学视频对入门帮助很大! (1)添加类库 点击解决方案名称(如12.demo)右键->添加->类->更改类名 (2)利用控件设计界面 常用控件:button/label/textbox/combobox: 具体控件用途

4 weekend110的hive入门

Hive和HBase都很重要,当然啦,各自也有自己的替代品. 在公司里,SQL有局限,大部分时候,不需写mr程序的,用hive这个工具. 公司里的懂java开发员工不一定每个公司都有,但懂SQL开发员工很多. Hive的替代品:impala.spark shark.spark sql… Hive.impala .spark shark.spark sql l….相比,Hive是最慢的,因为,它是依赖mapreduce框架. Hive是把SQL语言,翻译成mapreduce程序. Spark sq

hadoop笔记之Hive入门(Hive的体系结构)

Hive入门(二) Hive入门(二) Hive的体系结构 ○ Hive的元数据 Hive将元数据存储在数据库中(metastore),支持mysql.derby.oracle等数据库,Hive默认是derby数据库 Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表等),表的数据所在目录等 ○ HQL的执行过程 解释器.编译器.优化器完成HQL查询语句从词法分析.语法分析.编译.优化以及查询计划(Plan)的生成.生成的查询计划存储在HDFS中,并在随后有MapRed

git 入门操作

从已有的GIT仓库获取最新代码 git clone url 建立本地仓库,并提交至git-hub 生成ssh的公钥私钥对:ssh-keygen 从pc端打开生成的公钥,id_rsa.pub,复制并黏贴至git-hub的ssh-keys cd至程序文件夹,输入 git init 然后输入git add .(.代表所有文件也可以输入具体的单个文件名) 然后输入git commit -m “任意注释” 创建一个remote git remote add origin url(ssh.https.sub

EXCEL自定义符合自己习惯的操作环境及办公入门操作视频课程

课程目标Office软件默认的工作环境都是一样的,但默认的工作环境可能并不适合每个用户的使用习惯.为了更加高效地完成工作,通过本课程的学习,熟悉Excel2013定制操作环境的功能以及Excel办公入门操作.适用人群电脑爱好者.所有职场人士课程简介Office软件默认的工作环境都是一样的,但默认的工作环境可能并不适合每个用户的使用习惯.为了更加高效地完成工作,通过本课程的学习,熟悉Excel2013定制操作环境的功能. 第一章 Excel2013操作环境概述及布局模式更改.第二章 如何隐藏屏幕提