hive的union问题

内容来源：http://blog.csdn.net/azhao_dn/article/details/6921429

在hive上执行查询：

select count(*) from user_active_vv_20110801_31 where
active_type_3>0

UNION ALL

select count(*) from user_active_vv_20110801_31 where
active_type_7>0

union all

select count(*) from user_active_vv_20110801_31 where
active_type_9>0

union all

select count(*) from user_active_vv_20110801_31 where
active_type_11>0

union all

select count(*) from user_active_vv_20110801_31 where
active_type_12>0

union all

select count(*) from user_active_vv_20110801_31 where
active_type_17>0

union all

select count(*) from user_active_vv_20110801_31 where
active_type_22>0;

报错：

FAILED: Error in semantic analysis: Top level UNION
is not supported currently; use a subquery for the UNION

原来hive不支持顶层union，只能将union封装在子查询中；且必须为union的查询输出定义别名，正确的hql如下：

select * from (select count(*) as type3 from
user_active_vv_20110801_31 where
user_active_vv_20110801_31.active_type_3>0

UNION ALL

select count(*) as type3 from
user_active_vv_20110801_31 where
user_active_vv_20110801_31.active_type_7>0

union all

select count(*) as type3 from user_active_vv_20110801_31
where user_active_vv_20110801_31.active_type_9>0

union all

select count(*) as type3 from user_active_vv_20110801_31
where user_active_vv_20110801_31.active_type_11>0

union all

select count(*) as type3 from user_active_vv_20110801_31
where user_active_vv_20110801_31.active_type_12>0

union all

select count(*) as type3 from user_active_vv_20110801_31
where user_active_vv_20110801_31.active_type_17>0

union all

select count(*) as type3 from user_active_vv_20110801_31
where user_active_vv_20110801_31.active_type_22>0) tmp;

执行结果如下：

54211920

57691832

41080830

44067696

32052350

34341676

13968539

hive的union问题,布布扣,bubuko.com

时间： 2024-10-09 04:31:16

hive的union问题的相关文章

hive 中 union all

hive 中的union all是不能在sql语句的第一层使用的,否则会报 Top level UNION is not supported currently 错误: 例如如下的方式: select id,name from user where type = 1 union all select id,name from user where type = 2 上面的方式应该使用子查询的方式书写: select * from ( select id,name from user where

[HIve - LanguageManual] Union

Union Syntax select_statement UNION ALL select_statement UNION ALL select_statement ... UNION is used to combine the result from multiple SELECT statements into a single result set. Hive currently only supports UNION ALL (bag union), in which duplica

hive union all报错

今天在写一个sql的时候,使用了hive的union all,运行时报错. sql如下: select dimension_name,dt,dtype_name,uv,new_uv,old_uv,pv,stay_time from temp_bi.uv union all select '平台' dimension_name ,dt ,app_platform dtype_name ,count(distinct mid) uv ,count(distinct case when is_new

Hive优化总结

优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜. 理解hadoop的核心能力,是hive优化的根本.这是这一年来,项目组所有成员宝贵的经验总结. 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜. 2．对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,没半小时是跑不完的.map reduce作业初始化的时间是比较长的. 3.对sum,count来说,不存在数据倾斜问题.

Hive 12、Hive优化

要点:优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜. 理解hadoop的核心能力,是hive优化的根本. 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜. 2．对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,没半小时是跑不完的.map reduce作业初始化的时间是比较长的. 3.对sum,count来说,不存在数据倾斜问题. 4.对count(distinct )

Hive ive优化（important）

Hive ive优化要点:优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜. 理解hadoop的核心能力,是hive优化的根本. 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜. 2．对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,没半小时是跑不完的.map reduce作业初始化的时间是比较长的. 3.对sum,count来说,不存在数据倾斜问题. 4.对count

一例 Hive join 优化实战

由于 hive 与传统关系型数据库面对的业务场景及底层技术架构都有着很大差异,因此,传统数据库领域的一些技能放到 Hive 中可能已不再适用.关于 hive 的优化与原理.应用的文章,前面也陆陆续续的介绍了一些,但大多都偏向理论层面,本文就介绍一个实例,从实例中一步步加深对 hive 调优的认识与意识. 1.需求需求我做了简化,很简单,两张表做个 join,求指定城市,每天的 pv,用传统的 RDBMS SQL 写出来就这样的: SELECT t.statdate, c.cname, coun

Hive学习笔记：基础语法

Hive基础语法 1.创建表 – 用户表 CREATE [EXTERNAL外部表] TABLE [IF NOT EXISTS 是否存在] HUserInfo ( userid int comment ‘用户Id’, username string comment ‘用户名称’, userpwd string comment ‘用户密码’, createtime string comment ‘创建时间’ ) comment ‘用户信息表’ row format delimited fileds

Hive调优实战

Hive优化总结 ---by 食人花优化时,把hive sql当做map reduce程序来读,会有意想不到的惊喜. 理解hadoop的核心能力,是hive优化的根本.这是这一年来,项目组所有成员宝贵的经验总结. 长期观察hadoop处理数据的过程,有几个显著的特征: 1.不怕数据多,就怕数据倾斜. 2．对jobs数比较多的作业运行效率相对比较低,比如即使有几百行的表,如果多次关联多次汇总,产生十几个jobs,没半小时是跑不完的.map reduce作业初始化的时间是比较长的. 3.对su

猜你喜欢

步步为营-84-数字转化为金额的Js

说明:来不及细说了,老铁快上车 function fmoney(s, n) { console.log(s); n = n > 0 && n <= 20 ? n : 2; ...

QQ音乐API分析

QQ音乐API分析官网提供API 说明:此API主要针对移动端直接调用QQ音乐API用,API只能在QQAPP内执行,上线时间尚短. http://y.qq.com/m/api/api.html 分 ...

WorldWind源码剖析系列：图层管理器按钮类LayerManagerButton和菜单条类MenuBar

WorldWindow用户定制控件类中所包含的的可视化子控件主要有:图层管理器按钮类LayerManagerButton和菜单条类MenuBar.BmngLoader类中所包含的的可视化子控件主要有: ...

英语语法

英语 1.一般看见subject第一反应可能中文就是科目的意思,但是从语言学的角度来讲,它就是主语的意思. 2.语法包括词法和句法,vt代表的是及物动词. 3.family name姓=surname ...

了解关于Integer的缓存类IntegerCache

今天看了一下Integer的源码: public static Integer valueOf(String s) throws NumberFormatException { return Inte ...

Spring MVC系列：（2）视图解析器、URL映射器、适配器

1.默认的URL映射器.适配器和视图解析器 SpringMVC提供了默认的URL映射器.适配器和视图解析器. 在上一文中,springmvc-helloworld.xml内容如下: <?xml ...

python每日一类（2）：platform

根据官方文档的解释(https://docs.python.org/3.5/library/platform.html#module-platform): 学习其他人的代码如下: # python p ...

[遇见时光]中科院分词工具NLPIR，Not valid license or your license expired!

第一词运行的时候下载的版本不新,然后就报错Not valid license or your license expired!,后来在网上查了许久才发现,NLPIR经常更新,要使用最新的Data才可以 ...

const char * strchr ( const char * str, int character ); char * strchr ( char * str, int character ) ...

浅谈https\ssl\数字证书[转载]

在互联网安全通信方式上,目前用的最多的就是https配合ssl和数字证书来保证传输和认证安全了.本文追本溯源围绕这个模式谈一谈. 名词解释首先解释一下上面的几个名词: https:在http(超文本 ...

String相关操作

1.求字符串中连续出现最多的字串 pair<string, int> substring(const string& str) { int i, j, k, len = str.l ...

【转】C# DataTable 导出 Excel 进阶多行表头、合并单元格、中文文件名乱码

本文原创地址:http://blog.csdn.net/ranbolwb/article/details/8083983 ,转载请保留本行. 本例子是上一篇 DataTable 导出 Excel 的进 ...

Oracle 12c agent install for windows

在Oracle EM12c 中部署agent的方法分两种,一种是通过EM12c的控制台通过ssh直接把agent"推送"安装到被管理端,这种方法在linux平台的OMS和被管理端比 ...

Python的零碎的补充知识

1.如何设置相对路径: 方法一:先取path为当前目录的相对路径,再使用"path + "加上想要到达的路径,如下.参考自http://blog.csdn.net/porcupin ...

创建数据库和表例子

CREATE DATABASE testON PRIMARY( NAME =test_MDF, FILENAME = 'D:\0330141013\test_data.mdf', ...

在多排序条件下SQL获文章上一条、下一条记录

在我们开发CMS系统的时候经常会碰到需要根据当前记录来读取它的上一条记录或下一条记录的现像.单字段排序时SQL语句非常简单,但是当以多字段排序时应该怎么写呢?实际上也复杂,多字段无法搞定那么我们就需要 ...

cocos2dx 3d开源项目 fantasyWarrior3D 从零走起 5 [角色基类actor & AI实现]

1. 构造对象从actor.lua中可以看到一些"面向对象"概念实现 (1) 基本属性的"继承" Knight = class("Knight&qu ...

JavaScript（class0526）

什么是JavaScript? HTML只是描述网页长相的标记语言,没有计算.判断能力,如果所有计算.判断(比如判断文本框是否为空.判断两次密码是否输入一致)都放到服务器端执行的话网页的话页面会非常慢. ...

Jenkins 权限控制策略

一.概述我们再构建job时,需要对Jenkins的用户进行权限的控制,所以我写了一篇关于Jenkins 权限控制的策略配置路径:系统管理->Configure Global Security ...

Decode Ways，编码方式数量求解。动态规划问题。

问题描述: A message containing letters from A-Z is being encoded to numbers using the following mapping: ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.025 s.