dbms_stats包问世以后,我们可通过一种新的方式来为CBO收集统计数据。目前,已经不再推荐使用老式的Analyze分析表和dbms_utility方法来生成CBO统计数据。dbms_stats能良好地估计统计数据(尤其是针对较大的分区表),并能获得更好的统计结果,最终制定出速度更快的SQL执行计划。
--创建用于存放统计信息的舞台表
exec dbms_stats.create_stat_table (ownname => ‘SCOTT‘, stattab => ‘ST_T1‘, tblspace => ‘TBS1‘);
--删除存放统计信息的指定舞台表
exec DBMS_STATS.DROP_STAT_TABLE(‘scott‘, ‘ST_T1‘);
--使用export_table_stats过程导出统计信息,此时statid为T1_20160101
exec dbms_stats.export_table_stats(ownname =>‘SCOTT‘, tabname=>‘T1‘, stattab=>‘ST_T1‘, statid => ‘T1_20160101‘);
--使用import_table_stats导入之前过旧的统计信息(可以指定新的ownname)
exec dbms_stats.import_table_stats(ownname =>‘SCOTT‘, tabname=>‘T1‘, stattab=>‘ST_T1‘, statid => ‘T1_20160101‘, no_invalidate => true);
统计信息加锁/解锁
--锁住表的统计信息
exec dbms_stats.lock_table_stats(‘SCOTT‘,‘T1‘);
--解锁表的统计信息
exec dbms_stats.unlock_table_stats(‘SCOTT‘,‘T1‘);
更新schema或table的统计信息:
exec dbms_stats.gather_schema_stats(
ownname => ‘SCOTT‘,
options => ‘GATHER AUTO‘,
estimate_percent => dbms_stats.auto_sample_size,
method_opt => ‘for all columns size repeat‘,
degree => 8
);
EXEC DBMS_STATS.gather_table_stats(
ownname => ‘socct‘,
tabname =>‘T1‘,
estimate_percent =>100,
method_opt => ‘for all columns size auto‘,
cascade =>true,
degree => 8
);
estimate_percent选项
它允许Oracle的dbms_stats在收集统计数据时指定具体的采样比例,缺省是100
一个新的参数,自动估计要采样的一个segment的最佳百分比:estimate_percent => dbms_stats.auto_sample_size 在使用自动采样时,Oracle会为一个样本尺寸选择5到20的百分比。
method_opt选项
为了智能地生成直方图,Oracle为dbms_stats准备了method_opt参数。在method_opt子句中,还有一些重要的新选项,包括skewonly,repeat和auto:
method_opt=>‘for all columns size skewonly‘ -- skewonly选项会耗费大量处理时间,因为它要检查每个索引中的每个列的值的分布情况。
method_opt=>‘for all columns size repeat‘ -- 只会为现有的直方图重新分析索引,不再搜索其他直方图机会。定期重新分析统计数据时,你应该采取这种方式。
method_opt=>‘for all columns size auto‘ -- 根据数据分布以及应用程序访问列的方式来创建直方图(例如使用alter table xxx monitoring; 命令监视表时,使用auto选项)
并行收集
Oracle允许以并行方式来收集CBO统计数据,这就显著提高了收集统计数据的速度。但是,要想并行收集统计数据,你需要一台安装了多个CPU的SMP服务器。
gather_schema_stats 的 options参数
使用4个预设的方法之一,这个选项能控制Oracle统计的刷新方式:
gather——重新分析整个架构(Schema)。
gather empty——只分析目前还没有统计的表。
gather stale——只重新分析修改量超过10%的表(这些修改包括插入、更新和删除)。
gather auto——重新分析当前没有统计的对象,以及统计数据过期(变脏)的对象。注意,使用gather auto类似于组合使用gather stale和gather empty。
注意,无论gather stale还是gather auto,都要求进行监视。如果你执行一个alter table xxx monitoring命令,Oracle会用dba_tab_modifications视图来跟踪发生变动的表。这样一来,你就确切地知道,自从上一次分析统计数据以来,发生了多少次插入、更新和删除操作。
也有提到关于索引统计信息收集的负面影响,索引方面建议直接使用 alter index idx_name rebuild nologging;
与analyze相比dbms_stats具有很多优势,比如并行,比如分区信息统计等,但是dbms_stats在分析index的时候处理方式并不是太理想,dbms_stats分析 index时将会只统计leaf_blocks为当前有数据的 leaf block,而analyze则会统计为所有曾经被使用过的 leaf block number,很显然dbms_stats的统计结果会使 index fast full scan的成本被严重低估,在某些情况下会错误得选择 index fast full scan做为执行路径。