Oracle 查询转换之子查询展开

概念:子查询展开(Subquery Unnesting)是优化器处理带子查询的目标sql的一种优化手段,它是指优化器不再将目标sql中子查询当作一个独立的处理单元来单独执行,而是将该子查询转换为它自身和外部查询之间等价的表连接。这种等价连接转换要么是将子查询展开(即将该子查询中的表,视图从子查询中拿出来,然后和外部查询中的表,视图做表连接),要么是不拆开但是会把该子查询转换为一个内嵌视图(Inline View)然后再和外部查询中的表,视图做表连接。Oracle 会确保子查询展开所对应的等价连接转换的正确性,即转换后的sql和原sql在语义上一定是等价的。当然不是所有的子查询都能做子查询展开,有些子查询是不能做这种等价表连接转换的,这种情况下oracle就不会对其做子查询展开,也就是说此时oracle还是会将该子查询当作一个独立的处理单元来单独执行。另外,在oracle10g以后版本中,对于那种不拆开子查询但是会把该子查询转换成一个内嵌视图的子查询展开,只有当经过子查询展开后的等价改写sql的成本值小于原sql的成本值时,oracle才会对原sql执行子查询展开

子查询展开通常都会提高原sql的执行效率,因为如果原sql不做子查询展开,那么通常情况下该子查询就会在其执行计划的最后一步才被执行,并且会走filter类型的执行计划,这也就意味着对于外部查询所在结果集的没一条记录,该子查询就会被执行多少次,这种执行方式的执行效率通常情况不会太高,尤其在子查询中包含两个或两个以上表连接时,此时做子查询展开后的执行效率往往会比走filter类型的执行计划高很多。

Oracle 数据库里子查询前where条件如果是如下这些条件之一,那么这种类型的目标sql在满足了一定条件后就可以做子查询展开,

single-row,exists,not exists,in ,not in,any,all。

范例1:

SQL> set lines 200 pagesize 1000
in写法:
SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1
 WHERE t1.cust_id IN
  4         (SELECT t2.cust_id FROM sales t2 WHERE t2.amount_sold > 700)
  5  ;
Execution Plan
----------------------------------------------------------
Plan hash value: 2448612695
----------------------------------------------------------------------------------------------------------
| Id  | Operation     | Name | Rows  | Bytes |TempSpc| Cost (%CPU)| Time | Pstart| Pstop |
----------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT     | |  7059 |   158K| |  1583   (1)| 00:00:20 | | |
|*  1 |  HASH JOIN SEMI      | |  7059 |   158K|  1360K|  1583   (1)| 00:00:20 | | |
|   2 |   TABLE ACCESS FULL  | CUSTOMERS | 55500 |   704K| |   405   (1)| 00:00:05 | | |
|   3 |   PARTITION RANGE ALL| |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
|*  4 |    TABLE ACCESS FULL | SALES |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
----------------------------------------------------------------------------------------------------------
Predicate Information (identified by operation id):
---------------------------------------------------
any等价写法:
SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1
 WHERE t1.cust_id = ANY
  4   (SELECT t2.cust_id FROM sales t2 WHERE t2.amount_sold > 700)
  5  ;
Execution Plan
----------------------------------------------------------
Plan hash value: 2448612695
----------------------------------------------------------------------------------------------------------
| Id  | Operation     | Name | Rows  | Bytes |TempSpc| Cost (%CPU)| Time | Pstart| Pstop |
----------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT     | |  7059 |   158K| |  1583   (1)| 00:00:20 | | |
|*  1 |  HASH JOIN SEMI      | |  7059 |   158K|  1360K|  1583   (1)| 00:00:20 | | |
|   2 |   TABLE ACCESS FULL  | CUSTOMERS | 55500 |   704K| |   405   (1)| 00:00:05 | | |
|   3 |   PARTITION RANGE ALL| |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
|*  4 |    TABLE ACCESS FULL | SALES |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
----------------------------------------------------------------------------------------------------------
exists等价写法:
SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1
 WHERE t1.cust_id = ANY
  4   (SELECT t2.cust_id FROM sales t2 WHERE t2.amount_sold > 700)
  5  ;
Execution Plan
----------------------------------------------------------
Plan hash value: 2448612695
----------------------------------------------------------------------------------------------------------
| Id  | Operation     | Name | Rows  | Bytes |TempSpc| Cost (%CPU)| Time | Pstart| Pstop |
----------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT     | |  7059 |   158K| |  1583   (1)| 00:00:20 | | |
|*  1 |  HASH JOIN SEMI      | |  7059 |   158K|  1360K|  1583   (1)| 00:00:20 | | |
|   2 |   TABLE ACCESS FULL  | CUSTOMERS | 55500 |   704K| |   405   (1)| 00:00:05 | | |
|   3 |   PARTITION RANGE ALL| |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
|*  4 |    TABLE ACCESS FULL | SALES |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
----------------------------------------------------------------------------------------------------------
不展开,显然不合理,sales表要执行很多次:
SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1
 WHERE t1.cust_id IN (SELECT /*+ no_unnest */
                       t2.cust_id
                        FROM sales t2
                       WHERE t2.amount_sold > 700)

子查询展开后,变成hash 半连接:

等价写法:(如果cust_id是唯一键值)可以转换为内连接:

SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1, sales t2
 WHERE t1.cust_id= t2.cust_id
   AND t2.amount_sold > 700

如果是not in,则会转换为hash 反连接:

SQL> set autot trace
SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1
 WHERE t1.cust_id not in 
  4   (SELECT t2.cust_id FROM sales t2 WHERE t2.amount_sold > 700);
Execution Plan
----------------------------------------------------------
Plan hash value: 2850422635
----------------------------------------------------------------------------------------------------------
| Id  | Operation     | Name | Rows  | Bytes |TempSpc| Cost (%CPU)| Time | Pstart| Pstop |
----------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT     | | 48441 |  1088K| |  1583   (1)| 00:00:20 | | |
|*  1 |  HASH JOIN ANTI      | | 48441 |  1088K|  1360K|  1583   (1)| 00:00:20 | | |
|   2 |   TABLE ACCESS FULL  | CUSTOMERS | 55500 |   704K| |   405   (1)| 00:00:05 | | |
|   3 |   PARTITION RANGE ALL| |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
|*  4 |    TABLE ACCESS FULL | SALES |   560K|  5469K| |   526   (2)| 00:00:07 |     1 |    28 |
----------------------------------------------------------------------------------------------------------

把子查询转换成内联视图:

SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1
 WHERE t1.cust_id NOT IN
       (SELECT t2.cust_id
          FROM sales t2, products t3
         WHERE t2.prod_id = t3.prod_id and t2.amount_sold > 700)
Execution Plan
----------------------------------------------------------
Plan hash value: 1272298339
--------------------------------------------------------------------------------------------------------------
| Id  | Operation       | Name     | Rows  | Bytes |TempSpc| Cost (%CPU)| Time     | Pstart| Pstop |
--------------------------------------------------------------------------------------------------------------
|   0 | SELECT STATEMENT       |     | 48441 |1229K|     |1665   (1)| 00:00:20 |     |     |
|*  1 |  HASH JOIN ANTI        |     | 48441 |1229K|1360K|1665   (1)| 00:00:20 |     |     |
|   2 |   TABLE ACCESS FULL    | CUSTOMERS   | 55500 | 704K|     | 405   (1)| 00:00:05 |     |     |
|   3 |   VIEW       | VW_NSO_1    | 560K|7110K|     | 529   (2)| 00:00:07 |     |     |
|*  4 |    HASH JOIN       |     | 560K|9844K|     | 529   (2)| 00:00:07 |     |     |
|   5 |     INDEX FULL SCAN    | PRODUCTS_PK |  72 | 288 |     |   1   (0)| 00:00:01 |     |     |
|   6 |     PARTITION RANGE ALL|     | 560K|7657K|     | 526   (2)| 00:00:07 |   1 |  28 |
|*  7 |      TABLE ACCESS FULL | SALES     | 560K|7657K|     | 526   (2)| 00:00:07 |   1 |  28 |
--------------------------------------------------------------------------------------------------------------

这里oracle把子查询转换成内联视图 VM_NSO_1,然后再和外部查询中的表customers做hash半连接。

等价:

SELECT t1.cust_last_name, t1.cust_id
  FROM customers t1,
       (SELECT t2.cust_id
          FROM sales t2, products t3
         WHERE t2.prod_id = t3.prod_id
           AND t2.amount_sold > 700) vm_nso_1
 WHERE t1.cust_id semi = vm_nso_1.cust_id

子查询是否能够做子查询展开取决于如下两个条件:

子查询展开所对应的等价改写sql和原sql在语义上一定要完全等价的,如果改写后的sql和原sql并不一定能保持语义上的完全等价,这种类型的子查询就不能做子查询展开。

对于不能拆开的子查询但是会把它转换为一个内嵌视图的子查询展开,只有经过子查询展开的等价改写sql成本值小于原sql的成本值。oracle才会对目标sql执行子查询展开。

对于子查询展开的第一种情形(即将子查询展开,把该子查询中的表,视图从子查询中拿出来,然后和外部查询中表,视图做表连接),即使在oracle  10g以后的版本中,oracle也不会考虑子查询展开的成本,即oracle此时会认为这种情形下子查询展开的效率始终比不展开的效率高,这就意味着如果目标sql满足子查询展开的第一种情形。则oracle始终会做子查询展开,而不管经过子查询展开后的等价sql的成本值是否小于原sql的成本值。

时间: 2024-12-21 12:09:19

Oracle 查询转换之子查询展开的相关文章

Oracle学习(六):子查询

1.知识点:可以对照下面的录屏进行阅读 SQL> --子查询所要解决的问题:问题不能一步求解 SQL> --查询工资比SCOTT高的员工信息 SQL> --(1)使用普通方法 SQL> --1. SCOTT的工资 SQL> select sal from emp where ename='SCOTT'; SQL> --2. 查询比3000高的员工 SQL> select * 2 from emp 3 where sal>3000; SQL> --(2)

013.子查询和分页子查询(sql实例)

--1 子查询 如果子查询和表连接都实现的时候,推荐用表连接实现( 一般:能用表连接实现的就用表连接,有些情况用表连接不能 或者不易实现的再选择子查询) 系统:缓存,执行计划技术手段 --1 where 条件后 + 子查询 注意: 1 先执行的是子查询语句 2 子查询嵌套的层数越大,性能会随之递减 A) 当子查询写在比较运算符之后(=,!=,>,...)时 要求:子查询的查询结果不能多于1个(1,0(不会报错, 没有结果)) --eg select * from EMP where SAL>(

mysql---where子查询、form子查询、exists子查询

1.什么是子查询? 当一个查询是另一个查询的条件时,称之为子查询. 2.子查询有什么好处? 子查询可以使用几个简单命令构造功能强大的复合命令. 那么,现在让我们一起来学习子查询. 3.where型的子查询 给它个定义吧:where型的子查询就是把内层查询的结果当作外层查询的条件. 现在,我们来查询文章表里每组主题分类下评论最多的文章. 给定表如下: create table article(article_id int(3),article_title varchar(50),article_c

嵌套子查询和关联子查询

嵌套子查询:  1. 内部查询只处理一次 2. 与null比较,总得到null 3.先进行内部查询,然后再进行外部查询 关联子查询: 1.外部查询得到的每条记录传入到内部查询 2.内部查询基于外部查询传入的值 3.内部查询从其结果中把值传回到外部查询,外部查询使用这些值来完成其处理 什么时候使用? 外部查询返回较少记录时,关联子查询比嵌套子查询效率高; 内部查询返回较少记录时,嵌套子查询比关联子查询效率高. in和exists select * from A where cc in (selec

Oracle-27-集合操作(交集、并集、差集)&子查询之单行子查询

一.集合操作 1.UNION:并集运算. 语法结构: SQL>select 表1的列1, 表1的列2 from 表1 union select表2的列1, 表2的列2 from表2; 其中表1的列1和表1的列2是来自于表1的两列,表2的列1和表2的列2是来自于表2的两列,需要注意的是,如果union前面是n列,那么后面也必须是n列,即union前后列数必须相同.而且查询结果的列名是按照union前面n列的名称命名(如例1). 2.INTERSECT:交集运算. 语法结构: SQL>select

mysql优化---in型子查询,exists子查询,from 型子查询

in型子查询引出的陷阱:(扫更少的行,不要临时表,不要文件排序就快) 题: 在ecshop商城表中,查询6号栏目的商品, (注,6号是一个大栏目) 最直观的: mysql> select goods_id,cat_id,goods_name from goods where cat_id in (select cat_id from category where parent_id=6); 误区: 给我们的感觉是, 先查到内层的6号栏目的子栏目,如7,8,9,11 然后外层, cat_id in

第五章 复杂查询 5-3 关联子查询

一.普通子查询和关联子查询的区别 在对表中某一部分记录的集合进行比较时,就可以使用关联子查询.在细分的组内进行比较时,需要使用关联子查询. 使用关联子查询是,通常会使用"限定(绑定)"或者"限制"这样的语言. 重点:这里起到关键作用的是在子查询中添加的WHERE子句的条件,该条件指定在同一商品中对各商品的销售单价和平均单价进行比较.注:在使用关联子查询时,需要在表所 对应的列名之前加上表的别名,以"< 表名 >.< 列名 >&quo

Oracle基本语法&amp;&amp;函数&amp;&amp;子查询&amp;&amp;分页查询&amp;&amp;排序&amp;&amp;集合操作&amp;&amp;高级分组函数

一.  数据库 手工---文件管理---数据库 DB:Database 数据库. DBMS:管理数据库的软件.(oracle) 主流关系数据库: 1.      Oracle 2.      DB2 3.      SQL Server 基本没人使 4.      MySQL  基本没人用,免费 Linux 开源,可以发现漏洞补上 Windows服务器会有补丁,数据易泄漏 eclipse 日食 数据表(Table): 表的行(Row):记录 表的列(Column):字段 二.  关系型数据库 一

oracle 分组查询 子查询 统计查询 FROM加子查询临时表 查询高于平均工资 示例代码

---求平均工资 SELECT AVG(sal) FROM emp; -----------大于平均工资 SELECT e.ename,e.job,e.sal FROM emp e WHERE e.sal>(SELECT AVG(sal) FROM emp) -------- --e领导编号=m雇员编号 --emp雇员表,dept部门表 SELECT e.ename 雇员姓名,e.job 雇员职位,e.sal 雇员工资, m.ename 领导姓名,m.job 领导职位, d.dname 部门名称