sql优化点整理

此文是我最早开始sql优化至今整理的小知识点和经常遇到的问题，弄懂这些对优化大型的sql会有不少帮助

---------------------------------使用了多余的外连接-------------------------------------------------

使用多余的外连接

外连接是一个代价非常昂贵的执行过程。如果业务需要，这种操作是必要的，但是有时

候会出现人为的在SQL 中使用不必要的外连接，这实际上是因为有的开发人员担心遗漏一

些数据而刻意使用它，这就非常有可能留下隐患，让数据库选择昂贵的执行计划而不是最优

的那一个。

SQL> select * from t1;

A B

---------- ----------

1 101

2 102

3 103

4 104

5 105

6 106

7 107

8 108

9 109

已选择9 行。

SQL> select * from t2;

C D

---------- ----------

1001

2 1002

1003

4 1004

1005

6 1006

1007

8 1008

1009

已选择9 行。

通过下面这条语句，通过使用A 字段和T2 表C 字段关联，我们获取了T1 表上所有的

行以及T2 表上符合条件的行:

SQL> select a,b,c,d from t1,t2 where t1.a=t2.c(+) ;

A B C D

---------- ---------- ---------- ----------

2 102 2 1002

4 104 4 1004

6 106 6 1006

8 108 8 1008

1 101

3 103

5 105

7 107

9 109

SQL> select a,b,c,d from t1,t2 where t1.a=t2.c(+) and t2.d>1000;

A B C D

---------- --------- ---------- ----------

2 102 2 1002

4 104 4 1004

6 106 6 1006

8 108 8 1008

这条SQL 的意思是告诉数据库，我要得到T1 表上所有的行，并且用A 列和T2 表C

做关联，同时要求T2 表C 列的值大于1000.

让我们再看看另一条结果集完全一样的SQL：

SQL> select a,b,c,d from t1,t2 where t1.a=t2.c and t2.d>1000;

A B C D

---------- ---------- ---------- ----------

2 102 2 1002

4 104 4 1004

6 106 6 1006

8 108 8 1008

从结果集上来看，这是两条等价的SQL 语句，就是说，在这种情况下，外连接其实是

没有用的，是人为的在SQL 里设定的限制！如果仔细看一下第一条语句，我们不难发现，

条件中T2.C>1000 已经明确的指出，在结果集中，T2 表在任何一行，C 列都应该有值的，

也就是在这种情况下，根本就不需要使用外连接，业务逻辑上讲，外连接在这里是多余的。

这种情况在开发人员的代码中有时候会遇到，对他们来讲，只要保证结果集正确就好，但对

数据库来讲，在执行时可能会引起极大的性能差别。

---------------------------------all_rows / first_rows-------------------------------------------------

对于OLAP 系统，绝大多少时候数据库上运行着的是报表作业，执行基本上是聚合类的SQL

操作，比如GROUP BY，这时候，把优化器模式设置成all_rows 是恰当的。

而对于一些分页操作比较多的网站类数据库，设置成first_rows 会更好一些。

在SQL 里通过Hints 的方式来将优化模式转换成FIRST_ROWS

比如这样的一个每次取出10 条记录的分页查询：

Select * from

(SELECT /*+ first_rows(10) */ a.*,rownum rnum from

(SELECT /*+ first_rows(10) */ id,name from t1 order by id) a

Where rownum<=10)

Where rnum>=1;

alter session set optimizer_mode=all_rows;

alter session set optimizer_mode=first_rows;

---------------------------------join与left join-------------------------------------------------

当两表关联时，如a left join b，然后在b上有where条件，那么可去掉left。

不去掉left，会产生不必要的关联，严重的是，a left join b，一般会选择a表为驱动表，

这是为防止结果错误（当然优化器有可能看到where有b的条件去掉left）

无where时：

SQL> select * from t1

2 left join t2

3 on t1.a=t2.a

4 ;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

3 3 3 3

1 1

SQL> select * from t1

2 join t2

3 on t1.a=t2.a

4 ;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

3 3 3 3

where条件在t2表的关连建上：

SQL> select * from t1

2 join t2

3 on t1.a=t2.a

4 where t2.a=2

5 ;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

SQL> select * from t1

2 left join t2

3 on t1.a=t2.a

4 where t2.a=2

5 ;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

where条件在t2表的非关连建上：

SQL> select * from t1

2 join t2

3 on t1.a=t2.a

4 where t2.b=2

5 ;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

SQL> select * from t1

2 left join t2

3 on t1.a=t2.a

4 where t2.b=2

5 ;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

以下2种写法等价：

SQL> select * from t1

2 left join t2

3 on t1.a=t2.a

4 and t2.a=2

5 ;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

3 3

1 1

SQL> select * from t1,t2 where t1.a=t2.a(+) and t2.a(+)=2;

A B A B

---------- ---------- ---------- ----------

2 2 2 2

3 3

1 1

left join on and on 与 left join on where 的区别：

第一种是：先根据on过滤，再关联

第二种是：先关联再根据where过滤

这2种写法意义是不同的，

inner jion没这个特殊性，则条件放在on中和where中，返回的结果集是相同的

实验：

创建2张表

SQL> select * from table1;

ID ID_NAME

---------- ----------

1 10

2 20

3 30

SQL> select * from table2;

ID_NAME NAME

---------- ----------

10 AAA

20 BBB

30 CCC

第一种写法：t1只和t2的AAA关联，但还是显示所有行

SQL> select * from table1 t1

2 left join table2 t2

3 on t1.id_name=t2.id_name

4 and t2.name=‘AAA‘;

ID ID_NAME ID_NAME NAME

---------- ---------- ---------- ----------

1 10 10 AAA

3 30

2 20

即使and使用t1，因为left join，也会留下所有行

SQL> select * from table1 t1

2 left join table2 t2

3 on t1.id_name=t2.id_name

4 and t1.id=1;

ID ID_NAME ID_NAME NAME

---------- ---------- ---------- ----------

1 10 10 AAA

2 20

3 30

SQL> select * from table1 t1

2 left join table2 t2

3 on t1.id_name=t2.id_name

4 and t1.id=0;

ID ID_NAME ID_NAME NAME

---------- ---------- ---------- ----------

2 20

3 30

1 10

第二种写法：t1和t2所有行关联，结果集再过滤，所以只留下1行

SQL> select * from table1 t1

2 left join table2 t2

3 on t1.id_name=t2.id_name

4 where t2.name=‘AAA‘;

ID ID_NAME ID_NAME NAME

---------- ---------- ---------- ----------

1 10 10 AAA

----------------------------------------------------- with as ---------------------------------------------------------------

select * from (

with a as (select 1 from dual union all select 1 from dual),

b as (select renshu from (select rownum renshu from a,a,a,a,a,a,a,a,a,a,a,a,a,a,a,a,a) where renshu>30000 and renshu<100000 )

select distinct DECODE(mod(renshu, 3),

decode(mod(renshu, 5),

decode(mod(renshu, 7),

decode(mod(renshu, 11),

decode(mod(renshu, 23), 8, renshu))))) renshu1

from b

) aa where aa.renshu1 is not null;

-----------------------------------------------------分析函数 ---------------------------------------------------------------

分析函数的功能：排名

1、按照3种方式为cnt列排名

SQL> with t as

2 (select rownum * 10 cnt from dual connect by rownum < 5

3 union all

4 select rownum * 40 - 10 from dual connect by rownum < 3)t 表构造出10，20，30，30，40，70

5 select cnt,

6 row_number() over(order by cnt) rn,//排名无并列，且每个排名与紧接着的下一个排名都是连续的row_number()，不需要参数

7 rank() over(order by cnt) rk,//排名有并列，且并列的排名与紧接着的下一个排名不连续rank()

8 dense_rank() over(order by cnt) drk//排名有并列，且并列的排名与紧接着的下一个排名连续dense_rank()

9 from t;

CNT RN RK DRK

---------- ---------- ---------- ----------

10 1 1 1

20 2 2 2

30 3 3 3

30 4 3 3

40 5 5 4

70 6 6 5

已选择6行。

2、分组排名：按照dept分组后，按照sale用3种方式排名

SQL> select dept_id,

2 sale_date,

3 goods_type,

4 sale_cnt,

5 row_number() over(partition by dept_id order by sale_cnt desc) rn,//分组的话，使用partition by dept，排名用order by sale

6 rank() over(partition by dept_id order by sale_cnt desc) rk,//partition、order by均可以有多列

7 dense_rank() over(partition by dept_id order by sale_cnt desc) drk

8 from lw_sales

9 where trunc(sale_date, ‘MM‘) = date ‘2013-04-01‘ ;

DEPT_I SALE_DATE GOOD SALE_CNT RN RK DRK

------ -------------- ---- ---------- ---------- ---------- ----------

S00 18-4月 -13 G01 300 1 1 1

S01 20-4月 -13 G04 900 1 1 1

S01 13-4月 -13 G00 900 2 1 1

S01 15-4月 -13 G01 400 3 3 2

S01 07-4月 -13 G02 300 4 4 3

S01 03-4月 -13 G03 200 5 5 4

S02 05-4月 -13 G03 800 1 1 1

S02 05-4月 -13 G00 400 2 2 2

S02 22-4月 -13 G03 300 3 3 3

S02 06-4月 -13 G04 300 4 3 3

已选择10行。

分析函数的功能：相邻

–LAG 是取到排序后，向上相邻的记录

–LEAD 是取到排序后，向下相邻的记录

LAG/LEAD(v, n, dv) over(partition by a order by b):按照a分组后，每组按b排序，列出排序后v列前n行的值，没有找到则列出dv

例：先按deptno分组，再按sal排序，列出与ename相邻2行的ename，如果往上2行无数据为‘AAA‘，往下2行无数据为‘ZZZ’：

SQL> select deptno,

2 ename,

3 sal,

4 lag(ename, 2, ‘AAA‘) over(partition by deptno order by sal) lower_name,

5 lead(ename, 2, ‘ZZZ‘) over(partition by deptno order by sal) higher_name

6 from scott.emp;

DEPTNO ENAME SAL LOWER_NAME HIGHER_NAM

---------- ---------- ---------- ---------- ----------

10 MILLER 1300 AAA KING

10 CLARK 2450 AAA ZZZ

10 KING 5000 MILLER ZZZ

20 SMITH 800 AAA FORD

20 JONES 2975 AAA ZZZ

20 FORD 3000 SMITH ZZZ

30 JAMES 950 AAA WARD

30 MARTIN 1250 AAA TURNER

30 WARD 1250 JAMES ALLEN

30 TURNER 1500 MARTIN BLAKE

30 ALLEN 1600 WARD ZZZ

DEPTNO ENAME SAL LOWER_NAME HIGHER_NAM

---------- ---------- ---------- ---------- ----------

30 BLAKE 2850 TURNER ZZZ

LiKun AAA ZZZ

已选择13行。

同样可实现相同的行，只输出一次，如上例中10只输出一次

SQL> select (case

2 when deptno = lag(deptno, 1, -1) over(partition by deptno order by ename) then//如果deptno=上一行的deptno，则输出null；

3 null

4 else//如果不等于，则表示是新数据，直接显示deptno

5 deptno

6 end) deptno,

7 ename,

8 sal,

9 lag(ename, 2, ‘AAA‘) over(partition by deptno order by sal) lower_name,

10 lead(ename, 2, ‘ZZZ‘) over(partition by deptno order by sal) higher_name

11 from scott.emp;

DEPTNO ENAME SAL LOWER_NAME HIGHER_NAM

---------- ---------- ---------- ---------- ----------

10 CLARK 2450 AAA ZZZ

KING 5000 MILLER ZZZ

MILLER 1300 AAA KING

20 FORD 3000 SMITH ZZZ

JONES 2975 AAA ZZZ

SMITH 800 AAA FORD

30 ALLEN 1600 WARD ZZZ

BLAKE 2850 TURNER ZZZ

JAMES 950 AAA WARD

MARTIN 1250 AAA TURNER

TURNER 1500 MARTIN BLAKE

WARD 1250 JAMES ALLEN

LiKun AAA ZZZ

已选择13行。

分析函数的功能：统计

sum(cnt) over(partition by a order by b) 按a分组后，按b的顺序对cnt进行累计

例如：求出每个部门按商品类型分共累计多少销售额，以及部门中按商品类型累计的销售额

SQL> with t as

2 (select dept_id,

3 goods_type,

4 sum(sale_cnt) goods_sale_cnt

5 from lw_sales

6 group by dept_id, goods_type)

7 select dept_id,

8 goods_type,

9 goods_sale_cnt,

10 sum(goods_sale_cnt) over(partition by dept_id order by goods_type) cum_goods_sale_cnt

11 from t;

DEPT_I GOOD GOODS_SALE_CNT CUM_GOODS_SALE_CNT

------ ---- -------------- ------------------

S00 G00 400 400

S00 G01 330 730

S00 G03 1000 1730

S00 G04 1000 2730

S00 G05 900 3630

S01 G00 1600 1600

S01 G01 800 2400

S01 G02 1400 3800

S01 G03 800 4600

S01 G04 2530 7130

S02 G00 400 400

S02 G01 270 670

S02 G02 900 1570

S02 G03 1100 2670

S02 G04 300 2970

S02 G05 200 3170

已选择16行。

avg() over()平均值

例如：求出每个部门每种货物的累计销售额，以及这种货物在各部门中的平均销售额，以及他们的差

SQL> with t as

2 (select dept_id, goods_type, sum(sale_cnt) goods_sale_cnt

3 from lw_sales

4 group by dept_id, goods_type)

5 select dept_id,

6 goods_type,

7 goods_sale_cnt,

8 round(AVG(goods_sale_cnt) over(partition by goods_type), 2) avg_goods_sale_cnt,

9 goods_sale_cnt -

10 round(AVG(goods_sale_cnt) over(partition by goods_type), 2) dv_goods_sale_cnt

11 from t;

DEPT_I GOOD GOODS_SALE_CNT AVG_GOODS_SALE_CNT DV_GOODS_SALE_CNT

------ ---- -------------- ------------------ -----------------

S00 G00 400 800 -400

S01 G00 1600 800 800

S02 G00 400 800 -400

S00 G01 330 466.67 -136.67

S01 G01 800 466.67 333.33

S02 G01 270 466.67 -196.67

S01 G02 1400 1150 250

S02 G02 900 1150 -250

S00 G03 1000 966.67 33.33

S01 G03 800 966.67 -166.67

S02 G03 1100 966.67 133.33

S00 G04 1000 1276.67 -276.67

S01 G04 2530 1276.67 1253.33

S02 G04 300 1276.67 -976.67

S00 G05 900 550 350

S02 G05 200 550 -350

已选择16行。

max(col1) over(partition by col2 order by col3):partition可选；order by可选，写上表示依次选出最大，不写表示组内所有值的最大

按月分组列出销售额的最高和最低

SQL> select dept_id,

2 to_char(sale_date, ‘YYYY-MM‘) sale_month,

3 sum(sale_cnt) goods_sale_cnt，

4 max(sum(sale_cnt)) over(partition by to_char(sale_date, ‘YYYY-MM‘)) max_gsc,

5 min(sum(sale_cnt)) over(partition by to_char(sale_date, ‘YYYY-MM‘)) min_gsc

6 from lw_sales

7 where goods_type = ‘G01‘

8 group by dept_id, to_char(sale_date, ‘YYYY-MM‘)

9 ;

DEPT_I SALE_MO GOODS_SALE_CNT MAX_GSC MIN_GSC

------ ------- -------------- ---------- ----------

S00 2013-03 30 400 30

S01 2013-03 400 400 30

S02 2013-03 270 400 30

S00 2013-04 300 400 300

S01 2013-04 400 400 300

-----------------------------------------------------函数索引 ---------------------------------------------------------------

SQL> select job,count(distinct deptno) from scott.emp where mgr is not null group by job;

JOB COUNT(DISTINCTDEPTNO)

--------- ---------------------

CLERK 3

SALESMAN 1

MANAGER 3

ANALYST 1

SQL> set autot trace

SQL> select job,count(distinct deptno) from scott.emp where mgr is not null group by job;

执行计划

----------------------------------------------------------

Plan hash value: 3818262728

----------------------------------------------------------------------------------

----------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 5 | 105 | 4 (25)| 00:00:01 |

| 1 | HASH GROUP BY | | 5 | 105 | 4 (25)| 00:00:01 |

| 2 | VIEW | VM_NWVW_1 | 11 | 231 | 4 (25)| 00:00:01 |

| 3 | HASH GROUP BY | | 11 | 165 | 4 (25)| 00:00:01 |

|* 4 | TABLE ACCESS FULL| EMP | 11 | 165 | 3 (0)| 00:00:01 |

----------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

4 - filter("MGR" IS NOT NULL)

统计信息

----------------------------------------------------------

0 recursive calls

0 db block gets

6 consistent gets

0 physical reads

0 redo size

578 bytes sent via SQL*Net to client

415 bytes received via SQL*Net from client

2 SQL*Net roundtrips to/from client

0 sorts (memory)

0 sorts (disk)

4 rows processed

SQL> select job,count(distinct deptno) from scott.emp where nvl2(mgr,1,0)=1 group by job order by job;

执行计划

----------------------------------------------------------

Plan hash value: 2809461788

----------------------------------------------------------------------------------

----------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 1 | 21 | 4 (25)| 00:00:01 |

| 1 | SORT GROUP BY | | 1 | 21 | 4 (25)| 00:00:01 |

| 2 | VIEW | VM_NWVW_1 | 1 | 21 | 4 (25)| 00:00:01 |

| 3 | HASH GROUP BY | | 1 | 15 | 4 (25)| 00:00:01 |

|* 4 | TABLE ACCESS FULL| EMP | 1 | 15 | 3 (0)| 00:00:01 |

----------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

4 - filter(NVL2("MGR",1,0)=1)

统计信息

----------------------------------------------------------

1 recursive calls

0 db block gets

6 consistent gets

0 physical reads

0 redo size

575 bytes sent via SQL*Net to client

415 bytes received via SQL*Net from client

2 SQL*Net roundtrips to/from client

1 sorts (memory)

0 sorts (disk)

4 rows processed

SQL> create index i_emp_mgr on scott.emp(nvl2(mgr,1,0));

索引已创建。

SQL> select job,count(distinct deptno) from scott.emp where nvl2(mgr,1,0)=1 group by job order by job;

执行计划

----------------------------------------------------------

Plan hash value: 1097451957

--------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 1 | 21 | 3 (34)| 00:00:01 |

| 1 | SORT GROUP BY | | 1 | 21 | 3 (34)| 00:00:01 |

| 2 | VIEW | VM_NWVW_1 | 1 | 21 | 3 (34)| 00:00:01 |

| 3 | HASH GROUP BY | | 1 | 14 | 3 (34)| 00:00:01 |

| 4 | TABLE ACCESS BY INDEX ROWID| EMP | 1 | 14 | 2 (0)| 00:00:01 |

|* 5 | INDEX RANGE SCAN | I_EMP_MGR | 1 | | 1 (0)| 00:00:01 |

--------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

5 - access(NVL2("MGR",1,0)=1)

统计信息

----------------------------------------------------------

2 recursive calls

0 db block gets

4 consistent gets

0 physical reads

0 redo size

575 bytes sent via SQL*Net to client

415 bytes received via SQL*Net from client

2 SQL*Net roundtrips to/from client

1 sorts (memory)

0 sorts (disk)

4 rows processed

-----------------------------------------------------用 EXISTS 替换DISTINCT ---------------------------------------------------------------

当提交一个包含一对多表信息(比如部门表和雇员表)的查询时,避免在SELECT 子句中使用

DISTINCT. 一般可以考虑用EXIST 替换

例如:

低效:（nestloop，外加unique）

SELECT DISTINCT d.DEPTNO, d.DNAME

FROM scott.DEPT D, scott.EMP E

WHERE D.DEPTNO = E.DEPTNO

执行计划

----------------------------------------------------------

Plan hash value: 2401638402

----------------------------------------------------------------------------------

----------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 5 | 80 | 4 (25)| 00:00:01 |

| 1 | HASH UNIQUE | | 5 | 80 | 4 (25)| 00:00:01 |

| 2 | NESTED LOOPS | | 12 | 192 | 3 (0)| 00:00:01 |

| 3 | TABLE ACCESS FULL| DEPT | 4 | 52 | 3 (0)| 00:00:01 |

|* 4 | INDEX RANGE SCAN | EMP_DEPTNO | 3 | 9 | 0 (0)| 00:00:01 |

----------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

4 - access("D"."DEPTNO"="E"."DEPTNO")

filter("E"."DEPTNO" IS NOT NULL)

高效:（nestloop）

SELECT d.DEPTNO, d.DNAME

FROM scott.DEPT D

WHERE EXISTS (SELECT 1 FROM scott.EMP E WHERE E.DEPTNO = D.DEPTNO);

执行计划

----------------------------------------------------------

Plan hash value: 3369102344

---------------------------------------------------------------------------------

---------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 3 | 48 | 3 (0)| 00:00:01 |

| 1 | NESTED LOOPS SEMI | | 3 | 48 | 3 (0)| 00:00:01 |

| 2 | TABLE ACCESS FULL| DEPT | 4 | 52 | 3 (0)| 00:00:01 |

|* 3 | INDEX RANGE SCAN | EMP_DEPTNO | 8 | 24 | 0 (0)| 00:00:01 |

---------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

3 - access("E"."DEPTNO"="D"."DEPTNO")

filter("E"."DEPTNO" IS NOT NULL)

EXISTS 使查询更为迅速,因为RDBMS 核心模块将在子查询的条件一旦满足后,立刻返回结

果.

-----------------------------------------------------------索引合并 ---------------------------------------------------------------

empno和ename上都有unique索引，会根据2个索引的rowid做个bitmap合并

SQL> select * from scott.emp e where e.empno=7369 and ename=‘SMITH‘;

执行计划

----------------------------------------------------------

Plan hash value: 2575831182

-------------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 1 | 39 | 0 (0)| 00:00:01 |

| 1 | TABLE ACCESS BY INDEX ROWID | EMP | 1 | 39 | 0 (0)| 00:00:01 |

| 2 | BITMAP CONVERSION TO ROWIDS | | | | | |

| 3 | BITMAP AND | | | | | |

| 4 | BITMAP CONVERSION FROM ROWIDS| | | | | |

|* 5 | INDEX RANGE SCAN | PK_EMP | 1 | | 0 (0)| 00:00:01 |

| 6 | BITMAP CONVERSION FROM ROWIDS| | | | | |

|* 7 | INDEX RANGE SCAN | BBB | 1 | | 0 (0)| 00:00:01 |

-------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

5 - access("E"."EMPNO"=7369)

7 - access("ENAME"=‘SMITH‘)

-----------------------------------------------------------索引优先级 ---------------------------------------------------------------

empno上有唯一索引，deptno上为非唯一索引，但是查询选择使用depno上的索引，

虽然 EMPNO 是唯一性索引,但是由于它所做的是范围比较, 等级要比非唯一性索引的等式比较低!

SQL> select * from scott.emp e where e.empno>73 and deptno=20;

执行计划

----------------------------------------------------------

Plan hash value: 1182541070

------------------------------------------------------------------------------------------

------------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 3 | 117 | 2 (0)| 00:00:01 |

|* 1 | TABLE ACCESS BY INDEX ROWID| EMP | 3 | 117 | 2 (0)| 00:00:01 |

|* 2 | INDEX RANGE SCAN | EMP_DEPTNO | 3 | | 1 (0)| 00:00:01 |

------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

1 - filter("E"."EMPNO">73)

2 - access("DEPTNO"=20)

-----------------------------------------------------------Order by 使用索引 ---------------------------------------------------------------

ORDER BY 子句只在两种严格的条件下使用索引.

1ORDER BY 中所有的列必须包含在相同的索引中并保持在索引中的排列顺序.

2ORDER BY 中所有的列必须定义为非空.

SQL> select * from test1 order by id1;（未使用索引，因为列不是非空）

已选择8192行。

执行计划

----------------------------------------------------------

Plan hash value: 1692556001

------------------------------------------------------------------------------------

------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 8192 | 416K| | 125 (1)| 00:00:02 |

| 1 | SORT ORDER BY | | 8192 | 416K| 528K| 125 (1)| 00:00:02 |

| 2 | TABLE ACCESS FULL| TEST1 | 8192 | 416K| | 17 (0)| 00:00:01 |

------------------------------------------------------------------------------------

Note

-----

- dynamic sampling used for this statement (level=2)

统计信息

----------------------------------------------------------

0 recursive calls

0 db block gets

58 consistent gets

0 physical reads

0 redo size

176097 bytes sent via SQL*Net to client

6422 bytes received via SQL*Net from client

548 SQL*Net roundtrips to/from client

1 sorts (memory)

0 sorts (disk)

8192 rows processed

SQL> alter table test1 modify id1 not null;

表已更改。

SQL> select * from test1 order by id1;（走索引）

已选择8192行。

执行计划

----------------------------------------------------------

Plan hash value: 2136352608

-------------------------------------------------------------------------------------

-------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 8192 | 416K| 32 (0)| 00:00:01 |

| 1 | TABLE ACCESS BY INDEX ROWID| TEST1 | 8192 | 416K| 32 (0)| 00:00:01 |

| 2 | INDEX FULL SCAN | MMM | 8192 | | 19 (0)| 00:00:01 |

-------------------------------------------------------------------------------------

Note

-----

- dynamic sampling used for this statement (level=2)

统计信息

----------------------------------------------------------

30 recursive calls

0 db block gets

13526 consistent gets

17 physical reads

0 redo size

248747 bytes sent via SQL*Net to client

6422 bytes received via SQL*Net from client

548 SQL*Net roundtrips to/from client

4 sorts (memory)

0 sorts (disk)

8192 rows processed

-----------------------------------------------------------NOT in 与 NOT exists --------------------------------------------------------------

exist不检测实际的值~只是做一个存在判断就立刻返回~所以null值也返回给结果集了

in 会查询结果集除了null值不会返回以外还会过滤重复的值

这两个sql不等价：

SQL> SELECT count(*) FROM qdata.t_pub010 t1 WHERE t1.f006 NOT IN (SELECT t2.comcode FROM qdata.t_stk005 t2);

COUNT(*)

----------

8725

SQL> SELECT count(*) FROM qdata.t_pub010 t1 WHERE NOT exists (SELECT t2.comcode FROM qdata.t_stk005 t2 where t2.comcode=t1.f006) ;

COUNT(*)

----------

22092

跟这个才等价：

SQL> SELECT count(*) FROM qdata.t_pub010 t1 WHERE NOT exists (SELECT t2.comcode FROM qdata.t_stk005 t2 where t2.comcode=t1.f006) and t1.f006 is not null;

COUNT(*)

----------

8725

简单说就是not in不会统计结果为null的，而not exists只是逻辑判断，所以包含为null的结果：

SQL> select count(*) from scott.emp where comm not in (1000,300);

COUNT(*)

----------

-----------------------------------------------------------标量子查询的等价 --------------------------------------------------------------

DROP TABLE TEST111;

CREATE TABLE TEST111 (ID INT );

INSERT INTO TEST111 VALUES (1);

INSERT INTO TEST111 VALUES (2);

INSERT INTO TEST111 VALUES (3);

COMMIT;

DROP TABLE TEST222;

CREATE TABLE TEST222 (ID INT );

INSERT INTO TEST222 VALUES (1);

INSERT INTO TEST222 VALUES (2);

INSERT INTO TEST222 VALUES (NULL);

COMMIT;

如下两种写法等价

SELECT T1.ID , (SELECT T2.ID FROM TEST222 T2 WHERE ID=T1.ID) FROM TEST111 T1;

ID (SELECTT2.IDFROMTEST222T2WHERE

--------------------------------------- ------------------------------

1 1

2 2

SQL> SELECT T1.ID ,T2.ID FROM TEST111 T1 ,TEST222 T2 WHERE T1.ID=T2.ID(+);

ID ID

--------------------------------------- ---------------------------------------

1 1

2 2

如果不写成外连接，将不等价

SQL> SELECT T1.ID ,T2.ID FROM TEST111 T1 ,TEST222 T2 WHERE T1.ID=T2.ID;

ID ID

--------------------------------------- ---------------------------------------

1 1

2 2

如下是等价的 :

select a.username, count(owner)

from all_users a, all_objects b

where a.username = b.owner (+)

group by a.username;

select a.username,

(select count(*) from all_objects b where b.owner = a.username) cnt

from all_users a

-----------------------------------------------------------行列转换函数 --------------------------------------------------------------

LISTAGG，多行合并，11.2新特性

SQL> select listagg(comm,‘,‘) within group(order by empno) from scott.emp;

LISTAGG(COMM,‘,‘)WITHINGROUP(ORDERBYEMPNO)

--------------------------------------------------------------------------

1000,300,500,1400,0

说明：合并会忽略空值，不能去重，如果想去重，需要在from中用子查询distinct，如：根据deptno分组，把job合并。

SQL>select deptno,listagg(job,‘,‘) within group(order by job) list from (select distinct deptno,job from scott.emp) group by deptno;//去重后

DEPTNO LIST

---------- ------------------------------

10 CLERK,MANAGER,PRESIDENT

20 ANALYST,CLERK,MANAGER

30 CLERK,MANAGER,SALESMAN

SQL> select deptno,listagg(job,‘,‘) within group(order by job) list from scott.emp group by deptno;//未去重

DEPTNO LIST

---------- ------------------------------

10 CLERK,MANAGER,PRESIDENT

20 ANALYST,CLERK,MANAGER

30 CLERK,MANAGER,SALESMAN,SALESMAN,SALESMAN,SALESMAN

WM_CONCAT

SQL> select deptno,wmsys.wm_concat(job) from emp group by deptno;

DEPTNOWMSYS.WM_CONCAT(JOB)

------------------------------------------------------------------------------------------

10MANAGER,CLERK,PRESIDENT

20CLERK,ANALYST,CLERK,ANALYST,MANAGER

30SALESMAN,CLERK,SALESMAN,MANAGER,SALESMAN,SALESMAN

SQL> select deptno,wmsys.wm_concat(distinct job) from emp group by deptno;

DEPTNOWMSYS.WM_CONCAT(JOB)

------------------------------------------------------------------------------------------

10MANAGER,CLERK,PRESIDENT

20ANALYST,CLERK,MANAGER

30SALESMAN,CLERK,MANAGER

说明：合并会去重，10g以后有，不能排序，可以去重。未公开函数，10g返回值是varchar，11.2.0.3.2变为clob。可以用做分析函数

SQL> select deptno,to_char(wmsys.wm_concat(job) over(partition by deptno order by job)) a from scott.emp;

DEPTNO A

---------- ------------------------------------------------------------

10 CLERK

10 CLERK,MANAGER

10 CLERK,MANAGER,PRESIDENT

20 ANALYST

20 ANALYST,CLERK

20 ANALYST,CLERK,MANAGER

30 CLERK

30 CLERK,MANAGER

30 CLERK,MANAGER,SALESMAN,SALESMAN,SALESMAN,SALESMAN

-----------------------------------------------------------in 子查询改写 --------------------------------------------------------------

in的子查询可以成表关联方式，但是要注意去重

去重可通过group by或者distinct，否则会出现重复值

SQL> select * from az1;

----------

SQL> select * from az2;

----------

SQL> select * from az1 where n in (select n from az2);

----------

SQL> select * from az1,az2 where az1.n=az2.n group by az1.n,az2.n;

N N

---------- ----------

1 1

SQL> select distinct * from az1,az2 where az1.n=az2.n;

N N

---------- ----------

1 1

-----------------------------------------------------------根据某字段更新的优化 --------------------------------------------------------------

aaa表和bbb表是从scott.emp创建，至13000行，并把empno改成rownum；

原始语句：

update bbb set sal=(select sal from aaa where bbb.empno=aaa.empno) where bbb.job=‘PRESIDENT‘;

35S

优化为游标方式：

create or replace procedure fuck is

cursor allamt is

select a.sal, a.empno from aaa a, bbb b where a.empno = b.empno;

begin

FOR tc in allamt loop

update bbb b set b.sal = tc.sal where b.empno = tc.empno and b.job=‘PRESIDENT‘;

end loop;

commit;

end fuck;

exec fuck;

13s

再次优化为merge：

merge into bbb

using aaa

on (aaa.empno=bbb.empno)

when matched then

update set bbb.sal=aaa.sal , bbb.mgr=aaa.mgr

where bbb.job=‘PRESIDENT‘;

-----------------------------------------------------------insert all --------------------------------------------------------------

insert all

into a

into b

select * from dba_objects;

同时插入2张表，一个事务。一份复制，2份粘贴。性能更好。

分成2条写，有可能中间dba_objects数据有了变化，导致ab表不一致了。

-----------------------------------------------------------connect by实现行展开成列 --------------------------------------------------------------

WITH T AS (

SELECT ‘a‘ name ,1 ST, 4 EN FROM DUAL UNION ALL

SELECT ‘b‘ name ,1 ST, 4 EN FROM DUAL UNION ALL

SELECT ‘D‘ name ,3 ST, 3 EN FROM DUAL UNION ALL

SELECT ‘C‘ name ,7 ST, 9 EN FROM DUAL

)

SELECT T.name name

,ROW_NUMBER()OVER(PARTITION BY T.name ORDER BY 1)+T.ST-1 RN

FROM T

CONNECT BY LEVEL <= (T.EN-T.ST+1) AND T.name = PRIOR T.name AND PRIOR SYS_GUID() IS NOT NULL ;

时间： 2024-12-22 07:55:43

sql优化点整理

sql优化点整理的相关文章

sql优化提速整理

sql优化学习与知识整理（一）

数据库SQL优化大总结之百万级数据库优化方案

数据库SQL优化大总结之百万级数据库优化方案

数据库SQL优化大总结之百万级数据库优化方案（转载）

SQL优化的四个方面，缓存，表结构，索引，SQL语句

简明的sql优化

SQL优化之语句优化

数据库SQL优化大总结之百万级数据库优化方案【转载】