Hive常用命令及设置

alter table ad_app.app_accounting_daily add columns (return_cost bigint) cascade;

数据倾斜

set hive.map.aggr=true;

set hive.groupby.skewindata=true;

set mapreduce.job.queuename = root.data.adonline;

set mapred.reduce.tasks=8192;

set mapreduce.job.priority=VERY_HIGH;

Set hive.groupby.mapaggr.checkinterval = 100000

set mapred.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

set mapred.map.output.compression.codec=org.apache.hadoop.io.compress.GzipCodec;

set hive.exec.compress.intermediate=true;

set mapred.compress.map.output=true;

set mapred.max.split.size=256000000;        -- 决定每个map处理的最大的文件大小,单位为B

set mapred.min.split.size.per.node=1;         -- 节点中可以处理的最小的文件大小

set mapred.min.split.size.per.rack=1;

控制map数量

set mapred.max.split.size=128000000;

set mapred.min.split.size.per.node=64000000;

set mapred.min.split.size.per.rack=64000000;

set hive.input.format=org.apache.hadoop.hive.ql.io.CombineHiveInputFormat;

设置reducer最大个数

set hive.exec.reducers.max=8192;

控制map reduce内存

set mapreduce.map.memory.mb=4096;

set mapreduce.reduce.memory.mb=4096;

set mapreduce.reduce.java.opts=-Xmx3800M;

set mapred.child.map.java.opts=-Xmx3800M;

set mapreduce.map.java.opts=-Xmx3800M;

ALTER TABLE table_name ADD IF NOT EXISTS PARTITION (dt='20130101') LOCATION '/user/hadoop/warehouse/table_name/dt=20130101'; //一次添加一个分区

原文地址:http://blog.51cto.com/chenxiaolong/2090523

时间: 2024-10-11 12:15:48

Hive常用命令及设置的相关文章

hive常用命令

hive常用命令 show tables; 列出hive里面所有数据表名 desc userProfile; 显示数据表userProfile的基本表字段及字段type desc extended trackinfo; 显示数据表trackinfo的详细信息,包括字段说明,数据表等 /usr/local/cloud/hive/bin/hive 进入hive数据库 select attribute_name from pms_attribute where attribute_id=21000 a

vi常用命令与设置(不断修改中)

注:前缀':'表示vim命令(命令模式),前缀'$'表示为shell命令,表示Ctrl + W,表示Ctrl + Shift+ 6,无前缀者均为普通模式下的键盘按键.基本的插入与修改:        a       光标下一个字符处插入:        i       在当前光标处插入:        A       行尾插入:        o       在光标下新建一行插入:        r       键入替换一个字符:        R       键入替换所有字符:        

Hive - 常用命令

1. 创建表 创建表的语句: Create [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] [CLUSTERED BY (col_name, col_name, ...) [SORT

hive常用参数配置设置

hive.exec.mode.local.auto 决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行) true hive.exec.mode.local.auto.inputbytes.max 如果 hive.exec.mode.local.auto 为 true,当输入文件大小小于此阈值时可以自动在本地模式运行,默认是 128兆. 134217728L hive.exec.mode.local.auto.tasks.max 如果 hive.exec.mode.

关于centos环境下Flume+hadoop+hive常用命令

centos命令 进入root用户su root 1. 复制 2.解压tar.gztar zxvf xxx.tar.gz 3.文件操作 -创建文件夹mkdir mkdir /usr/ mkdir 文件名 -移动文件mv [options] 源文件或目录 目标文件或目录 —删除一个文件rm —删除一个文件夹 rm /home/test rm -r /home/test —文件赋权限cmod 1.txt 4.修改文件夹权限chown -R Hadoop.Hadoop /增加可执行读写权限chmod

Hive常用命令及作用

1-创建表 -- 内部表 create table aa(col1 string,col2 int) partitioned by(statdate int) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t': -- 外部表 create external table bb(col1 string, col2 int) partitioned by(statdate int) ROW FORMAT DELIMITED FIELDS TERMINATED

hbase shell常用命令

hive常用命令 show tables; 列出hive里面所有数据表名 desc userProfile; 显示数据表userProfile的基本表字段及字段type desc extended trackinfo; 显示数据表trackinfo的详细信息,包括字段说明,数据表等 /usr/local/cloud/hive/bin/hive 进入hive数据库 select attribute_name from pms_attribute where attribute_id=21000 a

Oracle主要用户与一些常用命令

Oracle的主要用户: l  超级管理员:sys l  普通管理员:system l  普通用户:scott Sqlplusw的一些常用命令: l  设置行显示数量:set linesize 长度 l  设置也显示数量:set pagesize 长度 l  ed及@指令 l  连接:conn 用户名/密码 as sysdba 如果忘记用户密码: win+R运行cmd: 运行sqlplus/nolog SQL>connect/as sysdba SQL>alter user scott ide

Linux 操作系统常用命令

常用命令详解 ls 常用选项: -a:列出所有文件,包括以.为开头的隐藏文件. -d ; 列出目录本身,并不包含目录里的内容. -h:和-l一起使用,文件大小容易阅读.文件的实际大小 ls -d/root 列出文件目录 ls -l /root 长输出 ls -lh /root 容易阅读 man man+命令 解释命令使用 pwd pwd 显示当前活动目录的名称 cd cd /tmp 切换目录到tmp cd .. 返回上一级目录 cd - 返回上次所处目录 cd ~ 返回切换到家目录 mkdir