HIVE:用外连接替代子查询

由于hive也支持sql,很多人会把hql跟标准sql进行比较,甚至有的时候会直接套用。hive不支持事务也不支持索引,更不支持追加写,但是对于一般的sql都是能够支持的。但是对于一些子查询确实无法支持的,例如

?





1

select * from t_ext_1_bkdoubledelete where
f1=(select
max(f1) from
t_ext_1_bkdoubledelete)

  这个sql在mysql中是能够支持的,意思是找到val最大的那一行记录,然后在hive中运行确实报错的;替代的是用左外连接:

?





1

select * from (select max(f1) as
maxf1 from
t_ext_1_bkdoubledelete) t1  left
outer join
(select * from t_ext_1_bkdoubledelete) t2 on
t1.maxf1=t2.f1

  在上面的外连接中,先生成一个临时表t1获取其中最大的值max(f1),然后以max(f1)为左值,通过对自己的连接获取到相关的行;从而获取到最大行;

下面的这个例子更有意义,使用外连接获取到用户的浏览记录。用户访问apapche后留下一条访问记录,对apache log的一个数据分析,现在hive里有一个表,一个字段是url,就是请求的网页的url,然后一个字段是time,按时间排序,想要得到所有的在访问百度之后访问的url,就比如说我访问了www.baidu.com,然后我访问了淘宝,那么www.taobao.com就是结果中的一条数据。

?





1

select t1.time1,t1.fromurl,t2.tourl from
<br>(select
time time1,url fromurl,userid from
urlLog) t1 <br>left 
outer join
<br>urlLog t2 <br>on
t1.userid=t2.userid <br>where
t1.time1<t2.time
and fromurl="www.baidu.com"

  

更加蛋疼的例子,可以看这个:

http://bbs.csdn.net/topics/390414342

时间: 2024-10-06 00:39:23

HIVE:用外连接替代子查询的相关文章

Hive学习之Union和子查询

Union的语法格式如下: select_statement UNION ALL select_statement UNION ALL select_statement ... Union用于将多个SELECT语句的查询结果合并到一个结果集中,目前Hive只支持UNION ALL,也就是结果集中的重复记录不会被删除.SELECT语句返回列的数目和名称必须相同,否则会报schema错误.Union语句还可以嵌套在FROM子句中: SELECT * FROM ( select_statement U

sql内连接、外连接和自连接查询

一. 前言: 通常在项目中对表的查询都是关联多张表,多表查询就涉及到sql的内连接.外连接和自连接查询.本篇文章将简单的介绍这些sql连接的使用,希望对大家有所帮助. 二. 数据准备: 先准备两张表: 1. 学生表:student select * from student; 2. 教师表:teacher select * from teacher; 三. 关联查询: 1. 内连接:在每个表中找出符合条件的共有记录.[x inner join y on...] 第一种写法:(只使用where)

java:Oracle(级联删除,左右内外交叉自然连接,子查询,all,any,in)

1.级联删除: -- 级联删除:裁员,公司倒闭 -- 级联删除(cascade),设置为null(setnull),放任不管(No action) -- cascade:(以一对多为例)如果删除多的一方,一的一方不受任何影响,但是如果删除一的一方,多的一方所有对应数据全部被删除 select * from staff s inner join department d on d.id = s.department_id; delete from staff s where s.id = 1; d

MySQL多表查询之外键、表连接、子查询、索引

一.外键: 1.什么是外键 2.外键语法 3.外键的条件 4.添加外键 5.删除外键 1.什么是外键: 主键:是唯一标识一条记录,不能有重复的,不允许为空,用来保证数据完整性 外键:是另一表的主键, 外键可以有重复的, 可以是空值,用来和其他表建立联系用的.所以说,如果谈到了外键,一定是至少涉及到两张表.例如下面这两张表: 上面有两张表:部门表(dept).员工表(emp).Id=Dept_id,而Dept_id就是员工表中的外键:因为员工表中的员工需要知道自己属于哪个部门,就可以通过外键Dep

mysql表连接,子查询以及if判断

创建表: CREATE TABLE emp ( ename varchar(10) DEFAULT NULL, hiredate date DEFAULT NULL, sal decimal(10,2) DEFAULT NULL, deptno int(2) DEFAULT NULL, age int(3) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8 CREATE TABLE dept ( deptno int(2) DEFAULT NUL

ORACLE 多表连接与子查询

Oracle表连接 SQL/Oracle使用表连接从多个表中查询数据 语法格式: select 字段列表from table1,table2where table1.column1=table2.column2; 说明: 在where子句中指定连接条件 当被连接的多个表中存在同名字段时,必须在该字段前加上"表名"作为前缀. 连接的类型 Oracle8i之前的表连接: 等值连接(Equijoin) 非等值连接(Non-Equijoin) 外连接(Outer join):-->左外连

MySQL数据库学习笔记(六)----MySQL多表查询之外键、表连接、子查询、索引

注:本文转自:http://www.cnblogs.com/smyhvae/p/4042303.html 本章主要内容: 一.外键 二.表连接 三.子查询 四.索引 一.外键: 1.什么是外键 2.外键语法 3.外键的条件 4.添加外键 5.删除外键 1.什么是外键: 主键:是唯一标识一条记录,不能有重复的,不允许为空,用来保证数据完整性 外键:是另一表的主键, 外键可以有重复的, 可以是空值,用来和其他表建立联系用的.所以说,如果谈到了外键,一定是至少涉及到两张表.例如下面这两张表: 上面有两

主外键,子查询

use lianxi0720gocreate table bumen( bcode int primary key,--部门编号 bname varchar(20), --部门名称 bceo varchar(20), --部门负责人 btel varchar(20) --部门电话)gocreate table renyuan( code int primary key identity(10001,1), name varchar(20), sex varchar(10), age int, b

Oracle_SQL(5) 连接和子查询

一.连接join一般分类: inner join: 内连接,又叫等值连接,只返回两个表中连接字段相等的行. left join :左连接,返回左表中所有的记录以及右表中连接字段相等的记录. right join :右连接,返回右表中所有的记录以及左表中连接字段相等的记录. full join:外连接,返回两个表中的行:left join + right join. cross join:笛卡尔积,就是第一个表的行数乘以第二个表的行数.oracle分类:等值连接 = 外连接(左外连接.右外连接.全