10g中HASH GROUP BY引起的临时表空间不足

原本在9i上可以顺利完成的CTAS脚本，迁移到10g后运行总是报“ORA-1652: unable to extend temp segment by 128 in tablespace TS_HQY1_TEMP “无法扩展临时表空间的错误。应用人员表示该脚本涉及的数据量在迁移前后变化不大，而且令人匪夷所思的是在新的10g库上临时表空间大小已达40多个G，要远大于原9i库。很显然这不是由于临时表空间过小导致的该问题，更多的原因肯定是出在迁移后Oracle不同的行为方式上。

该脚本每月执行一次用以汇总数据，其中一个单表接近4亿行记录，GROUP BY操作涉及到的数据量十分庞大。我们来具体看一下这个SQL:

create table gprs_bill.zou_201007_cell_id as

select

calling_num mobile_number,

lac,

lpad(cell_id, 5, ‘0‘) cell_id,

count(*) c,

sum(call_duration) call_duration,

sum(decode(record_type, ‘00‘, 1, 0) * call_duration) moc_call_duration,

sum(decode(record_type, ‘01‘, 1, 0) * call_duration) mtc_call_duarion

from gprs_bill.g_all_cdr01

where substr(calling_num, 1, 7) in (select mobile_prefix from gprs_bill.zou_mobile_prefix)

group by calling_num, lac, lpad(cell_id, 5, ‘0‘);

SQL> set autotrace traceonly exp

SQL> select

2 calling_num mobile_number,

3 lac,

4 lpad(cell_id,5,‘0‘) cell_id,

5 count(*) c,

6 sum(call_duration) call_duration,

7 sum(decode(record_type,‘00‘,1,0)*call_duration) moc_call_duration,

8 sum(decode(record_type,‘01‘,1,0)*call_duration) mtc_call_duarion

9 from gprs_bill.g_all_cdr01

10 where substr(calling_num,1,7) in (select mobile_prefix

11 from gprs_bill.zou_mobile_prefix)

12 group by calling_num , lac , lpad(cell_id,5,‘0‘);

Execution Plan

----------------------------------------------------------

Plan hash value: 212866585

--------------------------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes |TempSpc| Cost (%CPU)| Time|

--------------------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 229K| 9880K| | 1033K (3)| 03:26:41 |

| 1 | HASH GROUP BY | | 229K| 9880K| 22M| 1033K (3)| 03:26:41 |

|* 2 | HASH JOIN RIGHT SEMI| | 229K| 9880K| |1030K (3)| 03:26:10 |

| 3 | TABLE ACCESS FULL| ZOU_MOBILE_PREFIX|1692|13536||11 (0)|00:00:01 |

| 4 | TABLE ACCESS FULL| G_ALL_CDR01 |388M | 13G| | 1026K (2)| 03:25:21 |

--------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

2 - access("MOBILE_PREFIX"=SUBSTR("CALLING_NUM",1,7))

可以看到Oracle使用了HASH GROUP BY 算法以实现数据分组；HASH算法是10g中新引入的分组算法。

下面我们来详细介绍下10g中数据分组的改动：

在10g中GROUP BY操作仍将引发排序操作，但10g中引入了新的算法，这些算法都不保证返回的数据行有序排列；在10g中如果想保证”GROUP BY”后返回的数据有序排列则需要强制使用”ORDER BY”子句，这点和9i是截然不同的。若你没有指定”ORDER BY”子句，则不能保证返回的结果正确排序。

在10g中”GROUP BY”子句更倾向于使用一种HASH算法而非原先的SORT算法来分组数据，HASH算法的CPU COST要低于原先的SORT算法。但这2种算法在10g中都不保证返回数据正常排序，当采用SORT算法时可能”碰巧”出现返回正常排序数据的状况。

MOS建议，如果迁移中出现大量不利的变化，则可以通过修改参数来确保沿用原先的算法。但需要注意的是，即便采用了以下参数仍不能保证10g后”GROUP BY”后返回的数据如9i中那样排序，你需要做的是加入显式的”ORDER BY”子句以保证Oracle为你做到这一点。

alter session set "_gby_hash_aggregation_enabled" = false;

其中_gby_hash_aggregation_enabled隐式参数决定了Oracle是否可以启用新的HASH算法来进行数据分组(也适用于distinct等操作)。

对于以上说法我们通过实验进一步验证：

在11g中的测试如下：

SQL> select * from v$version;

BANNER

----------------------------------------------------------------------

Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - Production

PL/SQL Release 11.2.0.1.0 - Production

CORE 11.2.0.1.0 Production

TNS for 32-bit Windows: Version 11.2.0.1.0 - Production

NLSRTL Version 11.2.0.1.0 - Production

SQL> select * from youyus;

T1 T2

---------- ----------

A 10

B 10

F 30

G 30

H 40

I 40

J 40

L 20

M 20

已选择9行。

SQL> analyze table youyus compute statistics for all columns;

表已分析。

SQL> set autotrace on;

SQL> select t2,count(*) from youyus group by t2;

T2 COUNT(*)

---------- ----------

30 2

20 2

40 3

10 2

执行计划

----------------------------------------------------------

Plan hash value: 2940504347

-----------------------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |

-----------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 4 | 8 | 3 (34)| 00:00:01 |

| 1 | HASH GROUP BY | | 4 | 8 | 3 (34)| 00:00:01 |

| 2 | TABLE ACCESS FULL| YOUYUS | 9 | 18 | 2 (0)| 00:00:01 |

-----------------------------------------------------------------------------

SQL> select t2,count(*) from youyus group by t2 order by t2;

T2 COUNT(*)

---------- ----------

10 2

20 2

30 2

40 3

执行计划

----------------------------------------------------------

Plan hash value: 1349668650

-----------------------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes | Cost (%CPU)| Time |

-----------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 4 | 8 | 3 (34)| 00:00:01 |

| 1 | SORT GROUP BY | | 4 | 8 | 3 (34)| 00:00:01 |

| 2 | TABLE ACCESS FULL| YOUYUS | 9 | 18 | 2 (0)| 00:00:01 |

-----------------------------------------------------------------------------

SQL> alter session set "_gby_hash_aggregation_enabled" = false;

会话已更改。

SQL> select t2,count(*) from youyus group by t2;

T2 COUNT(*)

---------- ----------

10 2

20 2

30 2

40 3

执行计划

----------------------------------------------------------

Plan hash value: 1349668650

-------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes | Cost |

-------------------------------------------------------------

| 0 | SELECT STATEMENT | | 4 | 8 | 11 |

| 1 | SORT GROUP BY | | 4 | 8 | 11 |

| 2 | TABLE ACCESS FULL| YOUYUS | 9 | 18 | 2 |

-------------------------------------------------------------

Note

-----

- cpu costing is off (consider enabling it)

SQL> alter session set "_gby_hash_aggregation_enabled" =true;

会话已更改。

SQL> select t2,count(*) from youyus group by t2;

T2 COUNT(*)

---------- ----------

30 2

20 2

40 3

10 2

执行计划

----------------------------------------------------------

Plan hash value: 2940504347

-------------------------------------------------------------

| Id | Operation | Name | Rows | Bytes | Cost |

-------------------------------------------------------------

| 0 | SELECT STATEMENT | | 4 | 8 | 10 |

| 1 | HASH GROUP BY | | 4 | 8 | 10 |

| 2 | TABLE ACCESS FULL| YOUYUS | 9 | 18 | 1 |

-------------------------------------------------------------

Note

-----

- cpu costing is off (consider enabling it)

9i上的表现如下:

SQL> select * from v$version;

BANNER

----------------------------------------------------------------

Oracle9i Enterprise Edition Release 9.2.0.4.0 - Production

PL/SQL Release 9.2.0.4.0 - Production

CORE 9.2.0.3.0 Production

TNS for Linux: Version 9.2.0.4.0 - Production

NLSRTL Version 9.2.0.4.0 - Production

SQL> analyze table youyus_9i compute statistics for all columns;

Table analyzed.

SQL> select * from youyus_9i;

T1 T2

-- ----------

A 10

B 10

F 30

G 30

H 40

I 40

J 40

L 20

M 20

9 rows selected.

SQL> alter session set optimizer_mode=ALL_ROWS;

Session altered.

SQL> select t2,count(*) from youyus_9i group by t2;

T2 COUNT(*)

---------- ----------

10 2

20 2

30 2

40 3

Execution Plan

----------------------------------------------------------

0 SELECT STATEMENT Optimizer=ALL_ROWS (Cost=4 Card=4 Bytes=8)

1 0 SORT (GROUP BY) (Cost=4 Card=4 Bytes=8)

2 1 TABLE ACCESS (FULL) OF ‘YOUYUS_9I‘ (Cost=2 Card=21 Bytes=42)

SQL> alter session set "_gby_hash_aggregation_enabled" =true;

alter session set "_gby_hash_aggregation_enabled" =true

*

ERROR at line 1:

ORA-02248: invalid option for ALTER SESSION

That‘s great!

应用脚本没有数据一定要正确排序的强制要求，但使用HASH GROUP BY算法后临时表空间的使用量大幅上升，远大于之前在9i上的使用量，最后导致语句无法顺利完成。首先想到的当然是通过修改_gby_hash_aggregation_enabled参数恢复到原先的SORT算法，并观察其临时表空间使用量:

SQL> alter session set "_gby_hash_aggregation_enabled"=false;

Session altered.

SQL> select

2 calling_num mobile_number,

3 lac,

4 lpad(cell_id,5,‘0‘) cell_id,

5 count(*) c,

6 sum(call_duration) call_duration,

7 sum(decode(record_type,‘00‘,1,0)*call_duration) moc_call_duration,

8 sum(decode(record_type,‘01‘,1,0)*call_duration) mtc_call_duarion

9 from gprs_bill.g_all_cdr01

10 where substr(calling_num,1,7) in (select mobile_prefix from gprs_bill.zou_mobile_prefix)

11 group by

12 calling_num ,

13 lac,

14 lpad(cell_id,5,‘0‘);

Execution Plan

----------------------------------------------------------

Plan hash value: 4013005149

---------------------------------------------------------------------------------------------------

| Id | Operation | Name | Rows| Bytes |TempSpc| Cost (%CPU)| Time |

---------------------------------------------------------------------------------------------------

| 0 | SELECT STATEMENT | | 229K| 9880K| | 1033K (3)| 03:26:41 |

| 1 | SORT GROUP BY | | 229K| 9880K| 22M | 1033K (3)| 03:26:41 |

|* 2 | HASH JOIN RIGHT SEMI| | 229K| 9880K| |1030K (3) | 03:26:10 |

| 3 | TABLE ACCESS FULL| ZOU_MOBILE_PREFIX|1692|13536 ||11 (0)|00:00:01 |

| 4 | TABLE ACCESS FULL| G_ALL_CDR01 |388M| 13G| |1026K (2)| 03:25:21 |

---------------------------------------------------------------------------------------------------

Predicate Information (identified by operation id):

---------------------------------------------------

2 - access("MOBILE_PREFIX"=SUBSTR("CALLING_NUM",1,7))

create table gprs_bill.zou_201007_cell_id as

select

calling_num mobile_number,

lac,

lpad(cell_id,5,‘0‘) cell_id,

count(*) c,

sum(call_duration) call_duration,

sum(decode(record_type,‘00‘,1,0)*call_duration) moc_call_duration,

sum(decode(record_type,‘01‘,1,0)*call_duration) mtc_call_duarion

from gprs_bill.g_all_cdr01

where substr(calling_num,1,7) in (select mobile_prefix from gprs_bill.zou_mobile_prefix)

group by

calling_num ,

lac,

lpad(cell_id,5,‘0‘);

可以看到在会话级别设置_gby_hash_aggregation_enabled为false后，Oracle不再采用10g中的HASH分组算法；因为该CTAS SQL脚本运行时间较长，我们通过动态视图V$SORT_USAGE来观察其运行期间的排序段使用量:

SQL> set time on;

14:30:59 SQL> select tablespace,contents,segtype,blocks*8/1024

2 from v$sort_usage

3 where username=‘GPRS_BILL‘;

TABLESPACE CONTENTS SEGTYPE BLOCKS*8/1024

------------ ------------------ ------------------ -------------------------

TS_HQY1_TEMP TEMPORARY SORT 9349

14:35:59 SQL> /

TABLESPACE CONTENTS SEGTYPE BLOCKS*8/1024

------------------------------- --------- --------- -------------

TS_HQY1_TEMP TEMPORARY SORT 10011

15:02:46 SQL> select target ,totalwork,sofar,time_remaining,elapsed_seconds

2 from v$session_longops

3 where sofar!=totalwork;

TARGET TOTALWORK SOFAR TIME_REMAINING ELAPSED_SECONDS

---------------- ---------- ---------- -------------- ---------------

GPRS_BILL.G_ALL_CDR01 5575890 5435796 143 5557

15:05:10 SQL> select target ,totalwork,sofar,time_remaining,elapsed_seconds

2 from v$session_longops

3 where sofar!=totalwork;

TARGET TOTALWORK SOFAR TIME_REMAINING ELAPSED_SECONDS

---------- ----------------- ------------ -------------------- ---------------

GPRS_BILL.G_ALL_CDR01 5575890 5562082 14 5692

15:05:13 SQL> select tablespace,contents,segtype,blocks*8/1024

2 from v$sort_usage

3 where username=‘GPRS_BILL‘;

TABLESPACE CONTENTS SEGTYPE BLOCKS*8/1024

------------------------------- --------- --------- -------------

TS_HQY1_TEMP TEMPORARY SORT 13835

15:12:22 SQL> select tablespace,contents,segtype,blocks*8/1024

2 from v$sort_usage

3 where username=‘GPRS_BILL‘;

TABLESPACE CONTENTS SEGTYPE BLOCKS*8/1024

------------------------------- --------- --------- -------------

TS_HQY1_TEMP TEMPORARY SORT 13922

该分组操作最后排序段使用量为13922MB，在客户可以接受的范围内。看起来新引入的HASH算法虽然有CPU成本低于SORT算法的优势，但可能消耗大量临时空间，可谓有得有失。

时间： 2024-11-24 01:13:58

10g中HASH GROUP BY引起的临时表空间不足的相关文章

临时表空间过大解决方法

解决临时表空间过大有两种方法,方法一增加临时表空间的大小,方法二重建临时表空间,解决临时表空间过大的问题. 方案一:增加临时表空间的大小--1.临时表空间的使用情况SELECT D.tablespace_name, SPACE "SUM_SPACE(M)", blocks "SUM_BLOCKS", used_space "USED_SPACE(M)", R

oracle临时表空间 ORA-01652:无法通过16（在表空间XXX中）扩展 temp 字段

今天在查数据的时候报错 ORA-01652:无法通过16(在表空间temp1中)扩展 temp 字段查看表空间使用明细 SELECT b.tablespace, b.segfile#, b.segblk#, b.blocks, b.blocks * 32 / 1024 / 1024, a.sid, a.serial#, a.username, a.osuser, a.status, c.sql_text, b.contents FROM v$session a, v$sort_usage b

如何在oracle中缩小临时表空间？ORA-01652无法在表空间中扩展temp

查询临时表空间有多大: SQL> SELECT tablespace_name, file_name, bytes FROM dba_temp_files WHERE tablespace_name like 'TEMP%'; TABLESPACE_NAME FILE_NAME BYTES ----------------- -------------------------------- -------------- TEMP /the/full/path/to/temp01.dbf 13,9

sql中的group by 和 having 用法解析

--sql中的group by 用法解析:-- Group By语句从英文的字面意义上理解就是“根据(by)一定的规则进行分组(Group)”.--它的作用是通过一定的规则将一个数据集划分成若干个小的区域,然后针对若干个小区域进行数据处理.--注意:group by 是先排序后分组:--举例子说明:如果要用到group by 一般用到的就是“每这个字” 例如说明现在有一个这样的表:每个部门有多少人就要用到分组的技术select DepartmentID as '部门名称',COUNT(*) a

【翻译自mos文章】在10g中，当发生ORA-00020时，sqlplus登陆会报“connected to an idle instance”

在10g中.当发生ORA-00020时,sqlplus登陆会报"connected to an idle instance" 来源于: Sqlplus Logon Reports 'connected to an idle instance' when ORA-20 happens in 10g (文档 ID 1370000.1) 说的比較经典, 不做翻译,直接转帖: APPLIES TO: Oracle Server - Enterprise Edition - Version: 1

SQL 中的group by （转载）

概述原始表简单Group By Group By 和 Order By Group By中Select指定的字段限制 Group By All Group By与聚合函数 Having与Where的区别 Compute 和 Compute By 1.概述 “Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“数据集”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理. 2.原始表 3.简单Group By 示例1 select 类别,

【python】正则中的group()

来源:http://www.cnblogs.com/kaituorensheng/archive/2012/08/20/2648209.html 正则表达式中,group()用来提出分组截获的字符串,()用来分组 import re a = "123abc456" print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0) #123abc456,返回整体 print re.search("([0-9]*)(

IOS9.0中hash值的bug与解决方案

事件起因事情是这样的:产品上线发布,突然出现了问题.运营Gg过来反应,当场给露珠演示,运营同事的手机是iphone,bug确实是存在的.奇怪的是露珠用了其他iphone手机(借别人的,露珠的是吊死安卓机),却没有发现这个问题.仔细询问,同事说他最近刚刚升级的ios9,于是问题最初定位在操作系统上.接下来检查代码,发现运行正常,逻辑也没错.问题就卡到这里了.没办法,线上问题,fiddler替换本地脚本调试,一级一级alert,从项目文件到底层库,最后定位到了backbone.查看backbone

altersystem set recyclebin = off 报错 recyclebin 参数在11g和10g中的区别

在11g中altersystem set recyclebin = off 报错recyclebin 参数在11g和10g中的区别在Oracle 11g中,recyclebin参数发生了微小的变化. This supported parameter was introduced inOracle 10.2.0 Version ParameterName Data Type Session Modifiable Sys

猜你喜欢

Oracle Table连接方式分析

Oracle Table连接方式分析表连接基本知识: 1.哪张表将驱动查询(即访问的第一张表)?按照指定的路径查询,何时将访问到没一张表?可选的驱动路径有哪些? 2.可能出现哪些Oracle连接?记 ...

子啄我不是天生的王者但我骨子里流着不服输的血液

http://passport.baidu.com/?business&un=vip&un=%5F%E6%B8%85%E9%95%87%E4%B8%8A%E9%97%A8%E7%BE% ...

Codeforces Gym 100187K K. Perpetuum Mobile 构造

K. Perpetuum Mobile Time Limit: 20 Sec Memory Limit: 256 MB 题目连接 http://codeforces.com/gym/100187/pr ...

COT(x)

COT(x) 用于返回 x 的余切 mysql> SELECT COT(0.3), 1/TAN(0.3), COT(PI()/4); +--------------------+-------- ...

7、列表

list是有序的,从0开始到length-1 list可以进行的操作:索引.切片.加.乘.检查成员. 1.创建一个列表 1 list = ['google', 'roob', 1997, 2000] ...

Mybatis与Hibernate的对比

工作中,用了一段Hibernate与Mybatis,也在此简单的聊上几句,希望对大家有帮助. Mybatis与Hibernate不同,它不完全是一个ORM框架,因为Mybatis需要程序员自己编写sq ...

连载《一个程序猿的生命周期》- 32、两个企业急着上项目，紧急赶赴现场了解情况

一个程序猿的生命周期微信平台口号:职业交流,职业规划:面对现实,用心去交流.感悟. 公众号:iterlifetime二维码: 百木-ITer职业交流奋斗群:141588103 虽然主 ...

EasyuiCombobox三级联动

有许多刚接触Easyui中Combobox控件的朋友可能都会遇到的问题:如何将Combobox做成三级联动? 先本人有个三级联动的案例给大家参考参考,经测试能通过.注意Combobox绑定的数据是Js ...

尖括号的复合光电劲貂梦见放。。

http://blog.csdn.net/wjh200821/article/details/43821193 http://blog.csdn.net/wjh200821/article/detai ...

windows下配置Faster-RCNN

mark一个 http://yun.baidu.com/share/link?shareid=1018944597&uk=1543560377 http://blog.csdn.net/sin ...

html5中的Range的概念

最近打算给大家写一些html5入门教程,今天我们就来说说html5中的Range对象是什么.Range对象代表页面上一段连续的区域,通过Range对象可以获取或者修改页面上任何区域的内容.也可以通过R ...

LNMP源码平台搭建

一.Mysql(5.5.54)二进制免编译安装 1.下载和解压命令 wget http://mirrors.sohu.com/mysql/MySQL-5.5/mysql-5.5.54-linux2. ...

matlab V7.0 R14 安装教程

环境:win8系统 64位 1:下载matlab V7.0 R14安装包一般1点多G的都可以,,如果太小一般是不正确的或者是钓鱼网站,谨慎哦 2:配置环境变量计算机---->属性----&g ...

FPGA学习笔记之DDS

大纲: 什么是DDS? DDS是直接数字式频率合成器(Direct Digital Synthesizer)的英文缩写,与传统的频率合成器相比,DDS具有低成本,高分辨率,低功耗,高分辨率,和快速转换 ...

转：vue-router 2.0 常用基础知识点之router.push()

转载地址:http://www.jianshu.com/p/ee7ff3d1d93d router.push(location) 除了使用 <router-link> 创建 a 标签来定义 ...

checkbox的选中、全选、返选、获取所有选中的值、所有的值、单选全部时父选中

<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding= ...

nginx,php-fpm,phpfastcgi,upstream实现负载均衡

应用的最前端是一台nginx服务器,所有静态的内容都由nginx来处理,而将所有php的请求都分摊到下游的若干台运行php fastcgi守护进程的服务器中,这样可以以一种廉价的方案来实现对系统负载的 ...

angular1.x的简单介绍

angular1.x作为经典的mvc框架,可以创建能够复用的组件,也可进行双向数据绑定.国内的vue.js/avaloon.js都是同类型的框架.适合使用angularjs的项目有大型信息化管理系统: ...

mongodb首席架构师唐建法20core处理27万混合读写操

keyboardjs%E6%90%9E%E5%AE%9A%E9%94%AE%E7%9B%98%E7%BB%91%E5%AE%9A%E7%9A%84javascript%E5%BA%93 http:// ...

ajax中调用回调函数

<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.032 s.