在Oracle数据库操作中,为什么有时一个表的某个字段明明有索引,当观察一些语的执行计划确不走索引呢?如何解决呢?本文我们主要就介绍这部分内容,接下来就让我们一起来了解一下。
一、
不走索引大体有以下几个原因:
你在Instance级别所用的是all_rows的方式
你的表的统计信息(最可能的原因)
你的表很小,上文提到过的,Oracle的优化器认为不值得走索引。
解决方法:
可以修改init.ora中的OPTIMIZER_MODE这个参数,把它改为Rule或Choose,重起数据库。也可以使用4中所提的Hint。
不走索引的其它原因:
1、建立组合索引,但查询谓词并未使用组合索引的第一列,此处有一个INDEX SKIP SCAN概念。
2、在包含有null值的table列上建立索引,当时使用select count(*) from table时不会使用索引。
3、在索引列上使用函数时不会使用索引,如果一定要使用索引只能建立函数索引。
4、当被索引的列进行隐式的类型转换时不会使用索引。
如:select * from t where indexed_column =
5,而indexed_column列建立索引但类型是字符型,这时Oracle会产生隐式的类型转换,转换后的语句类似于select * from t where
to_number(indexed_column) = 5,此时不走索引的情况类似于case3。日期转换也有类似问题,如: select * from t
where trunc(date_col) = trunc(sysdate)其中date_col为索引列,这样写不会走索引,可改写成select * from
t where date_col >= trunc(sysdate) and date_col <
trunc(sysdate+1),此查询会走索引。
5、并不是所有情况使用索引都会加快查询速度,full scan table
有时会更快,尤其是当查询的数据量占整个表的比重较大时,因为full scan
table采用的是多块读,当Oracle优化器没有选择使用索引时不要立即强制使用,要充分证明使用索引确实查询更快时再使用强制索引。
6、<>
7、like’%dd’百分号在前。
Oracle数据库不能使用索引的原因定位
Oracle数据库有时候出现不能使用索引的现象,出现该现象的原因有很多,该怎么去定位呢?本文我们主要就介绍这一部分内容
首先,我们要确定数据库运行在何种优化模式下,相应的参数是: optimizer_mode 。可在 svrmgrl 中运行“ show
parameter optimizer_mode" 来查看。 ORACLE V7 以来缺省的设置应是 "choose" ,即如果对已分析的表查询的话选择
CBO
,否则选择 RBO 。如果该参数设为“ rule ”,则不论表是否分析过,一概选用 RBO ,除非在语句中用 hint 强制。
其次,检查被索引的列或组合索引的首列是否出现在 PL/SQL 语句的 WHERE 子句中,这是“执行计划”能。
第三,看采用了哪种类型的连接方式。 ORACLE 的共有 Sort Merge Join ( SMJ )、 Hash Join ( HJ
)和
Nested Loop Join ( NL )。在两张表连接,且内表的目标列上建有索引时,只有 Nested Loop 才能有效地利用到该索引。
SMJ
即使相关列上建有索引,最多只能因索引的存在,避免数据排序过程。 HJ 由于须做 HASH 运算,索引的存在对数据查询速度几乎没有影响。
第四,看连接顺序是否允许使用相关索引。假设表 emp 的 deptno 列上有索引,表 dept 的列 deptno 上无索引,
WHERE
语句有 emp.deptno=dept.deptno 条件。在做NL 连接时, emp
做为外表,先被访问,由于连接机制原因,外表的数据访问方式是全表扫描,
emp.deptno 上的索引显然是用不上,最多在其上。
第五,是否用到系统数据字典表或视图。由于系统数据字典表都未被分析过,可能导致极差的“执行计划。
第六,是否存在潜在的数据类型转换。如将字符型数据与数值型数据比较, ORACLE 会自动将字符型用to_number()
函数进行转换,从而导致第六种现象的发生。
第七,是否为表和相关的索引搜集足够的统计数据。对数据经常有增、删、改的表最好定期对表和索引进行分析,可用 SQL 语句“ analyze
table xxxx compute statistics for all indexes;" 。 ORACLE 掌。
第八,索引列的选择性不高。 我们假设典型情况,有表emp ,共有一百万行数据,但其中的emp.deptno列,数据只有 4
种不同的值,如 10
、 20 、 30 、 40 。虽然 emp 数据行有很多, ORACLE
缺省认定表中列的值是在所有数据行均匀分布的,也就是说每种 deptno 值各有 25
万数据行与之对应。假设 SQL 搜索条件 DEPTNO=10
,利用 deptno 列上的索引进行数据搜索效率,往往不比全表扫描的高, ORACLE 理不是在4
种deptno 值间平均分配,其中有99
万行对应着值10 , 5000 行对应值 20 , 3000 行对应值 30 , 2000 行对应值 40
。在这种数据分布图案中对除值为 10
外的其它 deptno 值搜索时,毫无疑问,如果索引能被应用,那么效率会高出很多。我们可以采用对该索引列进行单独分析,或用
analyze
语句对该列建立直方图,对该列搜集足够的统计数据,使 ORACLE 在搜索选择性较高的值能用上索引。
第九,索引列值是否可为空(
NULL
)。如果索引列值可以是空值,在 SQL 语句中那些需要返回 NULL 值的操作,将不会用到索引,如 COUNT ( *
),而是用全表扫描。这是因为索引中存储值不能为全空。
第十,看是否有用到并行查询( PQO )。并行查询将不会用到索引。如我们想要用到A
表的IND_COL1 “ SELECT /*+ INDEX ( A IND_COL1 ) */ * FROM A WHERE COL1 =
XXX;"注意,注释符必须跟在SELECT之后,且注释中的“ + ”要紧跟着注释起始符“ /* ”或“ -- ”,否则 hint 就被认为是一般注释,对
PL/SQL 语句的执行不产生任何影响。
一种是 EXPLAIN TABLE 方式。
用户必须首先在自己的模式( SCHEMA
)下,建立 PLAN_TABLE 表,执行计划的每一步骤都将记录在该表中,建表 SQL 脚本为在 ${ORACLE_HOME}/rdbms/admin/
下的
utlxplan.sql 打开 SQL*PLUS ,输入“ SET AUTOTRACE ON ”,然后运行待调试的 SQL
语句。在给出查询结果后,
ORACLE
将显示相应的“执行计划”,包括优化器类型、执行代价、连接方式、连接顺序、数据搜索路径以如果我们不能确定需要跟踪的具体 SQL
语句,比如某个应用使用一段时间后,响应速度忽然变慢。我们这时可以利用 ORACLE 提供的另一个有力工具 TKPROF ,对应用的执行过程全程跟踪。
我们要先在系统视图 V$SESSION 中,可根据 USERID 或 MACHINE ,查出相应的 SID 和 SERIAL#
。以SYS
或其他有执行 DBMS_SYSTEM 程序包的用户连接数据库,执行“ EXECUTE
DBMS_SYSTEM.SET_SQL_TRACE_IN_SESSION
( SID , SERIAL# , TRUE
);”。然后运行应用程序,这时在服务器端,数据库参“ USER_DUMP_DEST ”指示的目录下,会生成
ora__xxxx.trc 文件,其中
xxxx 为被跟踪应用的操作系统进程号。应用程序执行完成后,用命令 tkprof 对该文件进行分析。
命令示例:“ tkprof
tracefile outputfile explain=userid/password" 。在操作系统
ORACLE 用户下,键入“ tkprof
”,会有详细的命令帮助。分析后的输出文件 outputfile 中,有每一条 PL/SQL 语句的“执行计划”、
CPU
占用、物理读次数、逻辑读次数、执行时长等重要信息。根据输出文件的信息,我们可以很快发现应用中哪条 PL/SQL 语句是问题的症结所在。
关于Oracle数据库不能使用索引的原因定位就介绍到这里了,希望本次的介绍能够对您有所帮助。
二、
Oracle
索引使用(小技巧)
虽然索引并不总会快于全表扫描,但是很多时候我们希望Oracle使用索引来执行某些SQL,这时候我们可以通过index
hints来强制SQL使用index.
Index Hints的格式如下:
/*+ INDEX ( table
[index
[index]...] ) */
select /*+ index(t i_t) */ * from t where
username=‘EYGLE‘;
当WHERE条件中的字段是类似column1 is null 或者column1 is
not
null是,即便column1上面本来有索引也不会用到
比如where column1 =‘aaa’ 是可以用到索引的
下面的情况都用不到索引
column1||column2=‘aaabbb’
Substr(column1,1)=‘aaa’
Column1||’b’ =‘aaab’
Column3 + 1 > :a
Like
的字符串中第一个字符如果是‘%’则用不到索引
Column1 like ‘aaa%’ 是可以的
Column1
like ‘%aaa%’用不到
<>也用不到索引
有时可以采取适当措施改写后可以用到索引
例:column1
有3个值(‘A’,’B’,’C’),三个值的分布为‘A’ 10%, ‘B’ 80%,’C’ 10%,则column1 <> ‘B’
可以改写为column1 in(‘A’,’C’)
尽管In写法要比exists简单一些,exists一般来说性能要比In要高的多
用In还是用Exists的时机
当in的集合比较小的时候,或者用Exists无法用到选择性高的索引的时候,用In要好,否则就要用Exists
例:select
count(*) from person_info where xb in (select xb_id from dic_sex);
Select count(*) from n_acntbasic a where shbxdjm =:a and exists(select 1
from person_info where pid=a.pid and …);
Select * from person_info
where
zjhm=3101….;将会对person_info全表扫描
Select * from person_info where
zjhm
=‘3101…’才能用到索引
假定TEST表的dt字段是date类型的并且对dt建了索引。
如果要查‘20041010’一天的数据.下面的方法用不到索引
Select * from test where
to_char(dt,’yyyymmdd’) =‘20041010’;
而select * from test where dt
>=to_date(‘20041010’,’yyyymmdd’) and dt <
to_date(‘20041010’,’yyyymmdd’) +
1 将会用到索引。
如果能不用到排序,则尽量避免排序。
用到排序的情况有
集合操作。Union ,minus
,intersect等,注:union all 是不排序的。
Order
by
Group by
Distinct
In
有时候也会用到排序
确实要排序的时候也尽量要排序小数据量
,尽量让排序在内存中执行,有文章说,内存排序的速度是硬盘排序的1万倍。