验证Oracle收集统计信息参数granularity数据分析的力度

最近在学习Oracle的统计信息这一块,收集统计信息的方法如下:

DBMS_STATS.GATHER_TABLE_STATS (

ownname VARCHAR2, ---所有者名字

tabname VARCHAR2, ---表名

partname VARCHAR2 DEFAULT NULL, ---要分析的分区名

estimate_percent NUMBER DEFAULT NULL, ---采样的比例

block_sample BOOLEAN DEFAULT FALSE, ---是否块分析

method_opt VARCHAR2 DEFAULT ‘FOR ALL COLUMNS SIZE 1’,---分析的方式

degree NUMBER DEFAULT NULL, ---分析的并行度

granularity VARCHAR2 DEFAULT ‘DEFAULT’, ---分析的粒度

cascade BOOLEAN DEFAULT FALSE, ---是否分析索引

stattab VARCHAR2 DEFAULT NULL, ---使用的性能表名

statid VARCHAR2 DEFAULT NULL, ---性能表标识

statown VARCHAR2 DEFAULT NULL, ---性能表所有者

no_invalidate BOOLEAN DEFAULT FALSE, ---是否验证游标依存关系

force BOOLEAN DEFAULT FALSE); ---强制分析,即使锁表

本文主要对参数granularity进行了一下验证,

granularity:数据分析的力度

--global  ---全局

--partition ---只在分区级别做分析

--subpartition  --只在子分区级别做分析

验证步骤如下:

一、创建一个分区表并插入两条数据,同时在字段ID上创建索引

drop table test purge;

create table test(id number) partition by range(id)

(partition p1 values less than (5),

partition p2 values less than (10)

) ;

insert into test values(1);

insert into test values(6);

commit;

create index ind_id on test(id);

二、收集表的统计信息

exec dbms_stats.gather_table_stats(user,‘TEST‘,cascade=>true);

三、查询表的统计信息

select num_rows,blocks,last_analyzed from user_tables where table_name = ‘TEST‘;

结果如下:

num_rows:表数据行数

blocks:数据块数

last_analyzed:最近分析时间

四、查询表分区信息

select partition_name,num_rows,blocks,last_analyzed from dba_tab_partitions where table_name =‘TEST‘;

PARTITION_NAME:分区名称

NUM_ROWS:数据行数

BLOCKS:数据块数

last_analyzed:最近分析时间

五、查询索引统计信息

select num_rows,blevel,last_analyzed from user_indexes where index_name = ‘IND_ID‘;

num_rows:索引数据行数

blevel:索引高度

last_analyzed:分析时间

六、新增一个分区

alter table test add partition pmax values less than(maxvalue);

七、往新的分区中插入10000条数据

begin for i in 1..10000 loop ---插入10000条数据

insert into test values(100);

end loop;

commit;

end;

八、创建一个倾斜度非常大的分区

update test set id=10000 where id=100 and rownum=1; ---创造一个非常倾斜的Pmax分区

Commit;

九、查询分区数据

select id,count(*) from test partition(pmax) group by id;

十、不做分析,再次查询表的统计信息

select num_rows,blocks,last_analyzed from user_tables where table_name = ‘TEST‘;

发现数据行数量和数据块数量没有发现变化

十一、查询id=100时执行计划

set autotrace traceonly

set linesize 1000

select * from test where id=100;

发现走了索引,正常情况下,因为id=100的数据在一个倾斜度非常高的分区pmax中,id为100的数据有9999条,走索引的代价会比走全表的代价还要高(因为走索引需要回表),如果统计信息正确,优化器应该会选择走全表,但是这里没走全表而是走了索引,这里怀疑是统计信息不正确导致,后面验证

十二、收集分区统计信息

exec dbms_stats.gather_table_stats(user,‘TEST‘,partname => ‘PMAX‘,granularity => ‘PARTITION‘);

十三、再次查询表的统计信息和分区统计信息

select partition_name,num_rows,blocks,last_analyzed from dba_tab_partitions where table_name =‘TEST‘;

发现和步骤四比较,分区信息有了变化,说明对分区进行统计信息收集后,分区信息进行了更新

select num_rows,blocks,last_analyzed from user_tables where table_name = ‘TEST‘;

发现和步骤三想比,表的统计信息并没有发生变化,说明统计了分区信息后,表的统计信息么有更新

十四、再次查询id=100的数据

仍然走索引,说明在评估查询的时候,表的统计信息依然陈旧

十五、查询索引的统计信息

select num_rows,blevel,last_analyzed from user_indexes where index_name = ‘IND_ID‘;

发现索引统计信息较步骤五没有变化,说明收集了分区的统计信息后,表的索引信息没有更新

十六、重新再次收集表的统计信息

exec dbms_stats.gather_table_stats(user,‘TEST‘,cascade =>true);

十七、查询表的统计信息以及索引的统计信息

select num_rows,blocks,last_analyzed from user_tables where table_name = ‘TEST‘;

表的统计信息已经更新

select num_rows,blevel,last_analyzed from user_indexes where index_name = ‘IND_ID‘;

索引的统计信息也已经更新

十八、再次查询id=100的执行计划

这次发现走了全表,说明收集了全局的统计信息后,表的统计信息准确了,评估也就准确了。

时间: 2025-01-18 00:54:32

验证Oracle收集统计信息参数granularity数据分析的力度的相关文章

ORACLE 收集统计信息

原文链接:http://blog.itpub.net/2317695/viewspace-1226138/ 今天网上看到一篇关于收集统计信息的文章,还不错,特转载下来. 1.     理解什么是统计信息 优化器统计信息就是一个更加详细描述数据库和数据库对象的集合,这些统计信息被用于查询优化器,让其为每条SQL语句选择最佳的执行计划.优化器统计信息包括: ·         表的统计信息 o   行数 o   Block数 o   行平均长度 ·         列的统计信息 o   列中不同值的

Oracle 判断 并 手动收集 统计信息 脚本

CREATE OR REPLACE PROCEDURE SchameB.PRC_GATHER_STATS AUTHID CURRENT_USER IS BEGIN SYS.DBMS_STATS.GATHER_TABLE_STATS('SchName', 'TableName', CASCADE => TRUE); END; / select owner,table_name,last_analyzed,num_rows from dba_tables where owner='SYSTEM' a

Oracle 学习之性能优化(四)收集统计信息

emp表有如下数据. SQL> select ename,deptno from emp; ENAME    DEPTNO ------------------------------ ---------- SMITH        20 ALLEN        30 WARD        30 JONES        20 MARTIN        30 BLAKE        30 CLARK        10 SCOTT        20 KING        10 TUR

Oracle 11g系统自己主动收集统计信息的一些知识

在11g之前,当表的数据量改动超过总数据量的10%,就会晚上自己主动收集统计信息.怎样推断10%.之前的帖子有研究过:oracle自己主动统计信息的收集原理及实验.这个STALE_PERCENT=10%,是无法改动的,假设表很大.10%是许多的数据,很有可能造成统计信息不准确. 在11g之后,STALE_PERCENT=10%是能够改动的,分为全局(DBMS_STATS.SET_GLOBAL_PREFS )和表级别(DBMS_STATS.SET_TABLE_PREFS).表级别的设定: 改动为5

Oracle自动统计信息的收集原理及实验

[日期:2014-11-21]来源:Linux社区  作者:stevendbaguo[字体:大 中 小] 从Oracle Database 10g开始,Oracle在建库后就默认创建了一个名为GATHER_STATS_JOB的定时任务,用于自动收集CBO的统计信息.这个自动任务默认情况下在工作日晚上10:00-6:00和周末全天开启. 调用DBMS_STATS.GATHER_DATABASE_STATS_JOB_PROC收集统计信息.该过程首先检测统计信息缺失和陈旧的对象.然后确定优先级,再开始

[Oracle] 11G自己主动收集统计信息

在11g中,默认自己主动收集统计信息的时间为晚上10点(周一到周五,4个小时),早上6点(周六,周日,20个小时),例如以下所看到的: select a.window_name, a.repeat_interval,a.duration from dba_scheduler_windows a, dba_scheduler_wingroup_members b where a.window_name = b.window_name and b.window_group_name = 'MAINT

并行和并发收集统计信息

并行和并发收集统计信息 概述 随着应用数据的增多和表量的增加,为了增加统计信息收集的效率,Oracle推出了并行和并发收集统计信息的方法. 本文将针对并行和并发收集统计信息的相关知识内容以及部分案例进行介绍,并重点介绍并发统计信息收集. 并行收集统计信息(PARALLEL ) 当某个表的Size特别大时,可以通过并行的Slave进程共同工作来加快统计信息收集的效率. 默认情况下,数据库能够根据在表或者索引级别设置的并行度(默认:1)进行并行统计信息收集. 但我们也可以通过显示地设置degree参

Oracle Mysql 统计信息

我们知道Oracle的统计信息将严重影响CBO对执行计划的选择,针对不同大小的表制定收集规则并且定期执行是非常重要的.Oracle通过如下脚本即可收集统计信息: BEGIN DBMS_STATS.GATHER_TABLE_STATS(ownname =>'ZBDBA', tabname =>'TEST', estimate_percent =>30, method_opt =>'for all columns size repeat', no_invalidate =>FAL

oracle学习----统计信息

1.收集统计信息的方式 for all columns size skewonly BEGIN  DBMS_STATS.GATHER_TABLE_STATS(ownname          => 'SCOTT',                                tabname          => 'TEST',                                estimate_percent => 100,