复合索引使用的先决条件

PS:懒得重新编辑图片了,直接把我从51上的日志拷过来了。


背景:

今天,接到一个项目的项目经理电话,告之说生产环境有几个查询超级慢,就是查询单张表的数据,查询条件也很简单,但是加了索引以后并没有走索引,依然还是走的全表扫描。
听到该问题描述,我开始浮想联翩,统计信息太旧?存在隐式转换?索引树倾斜度太高,导致oracle认为走索引的成本更高?
带着各种可能的原因猜想,火速赶到了现场,发现原来都是我想多了。不走索引单纯是建立的索引不合理,查询条件是多个字段,应该建立复合索引,现场维护人员只对其中单个字段建立了索引,ORACLE认为不如走全表扫描开销小,所以没走索引。
汗~~~~~~
添加索引的时候发现,几个不同的查询,查询条件字段都一样,但是写的顺序却不一样(开发写SQL太随意了!!!!字段一样,顺序也写成一样啊!!!!!!!),结果先剧透一下,同样也是可以走索引的。而由此联想到些问题,于是在解决完效率问题后,在个人环境上做了一个验证。
这个就是完整的背景。

---------------------------------------------------
验证内容:
ORACLE 11GR2 复合索引的使用条件。
前提条件:
创建一张表,并对字段A、B建立组合索引,顺序为index(A、B);
测试场景:
针对以下6个场景进行测试:
1、查询条件为:A=‘XXX‘ and B=‘YYY‘;  顺序完全一致的情况;
2、查询条件为:B=‘YYY‘ and A=‘XXX‘;  顺序不一致的情况;
3、查询条件为:A=‘XXX‘;              单个字段且为复合索引前导列的情况;
4、查询条件为:B=‘YYY‘;              单个字段且不是复合索引前导列的情况;
5、查询条件为:C=‘ZZZ‘ and A=‘XXX‘;  查询条件既包含其它字段,也包含复合索引前导列的情况;
6、查询条件为:C=‘ZZZ‘ and B=‘YYY‘;  查询条件既包含其它字段,也包含复合索引非前导列字段的情况;
7、查询条件为:C=‘ZZZ‘ and A=‘XXX‘ and B=‘YYY‘;  查询条件除复核索引字段外还包括其它字段,且索引外字段在第一位;

---------------------------------------------------
执行过程:

创建测试数据:
create table test_index_demo(recid  RAW(16) not null,customer_id RAW(16) not null,product_id  RAW(16) not null)
create unique index index_test on test_index_demo (CUSTOMER_ID, PRODUCT_ID)
根据查询字段做笛卡尔积准备了将近3000万数据;
exec dbms_stats.gather_index_stats(ownname => ‘gboss‘,indname =>‘test_index_demo‘);

分别针对每个场景进行测试,查看执行计划如下:
场景一:
select
* from TEST_INDEX_DEMO T WHERE
T.CUSTOMER_ID=HEXTORAW(‘01540EAA1D8E690099261D41257815D9‘) AND
T.PRODUCT_ID=HEXTORAW(‘01540EAB83EC6900E30EAD424661D792‘);

此处是走索引的,符合预期;

场景二:
select * from TEST_INDEX_DEMO T WHERE
T.PRODUCT_ID=HEXTORAW(‘01540EAB83EC6900E30EAD424661D792‘) AND T.CUSTOMER_ID=HEXTORAW(‘01540EAA1D8E690099261D41257815D9‘);

此处可以看到ORACLE的优化器实际上把查询条件的顺序进行了调整,所以同样走了索引,符合预期;

场景三:
select * from TEST_INDEX_DEMO T WHERE
T.CUSTOMER_ID=HEXTORAW(‘01540EAA1D8E690099261D41257815D9‘);

此处因为查询条件为复合索引的前导列,所以走了索引,符合预期;

场景四:
select * from TEST_INDEX_DEMO T WHERE
T.PRODUCT_ID=HEXTORAW(‘01540EAB83EC6900E30EAD424661D792‘);

此处没有走索引,走的全表扫描,我原本以为即便不是复合索引的前导列,也会走索引的,看来我原来的认识是错误的。

对这个我特意临时添加了index(B、A)验证了一下,是因为查询条件字段不是复合索引前导列导致,还是因为出于其它方面的成本考虑,测试发现,添加了
index(B、A)顺序的索引后,该SQL就可以走索引了,所以应该可以认为是查询条件字段不是复合索引前导列导致的。

场景五:
select * from TEST_INDEX_DEMO T WHERE
T.RECID=HEXTORAW(‘01540ED5DA7069465FB7E42D07EDC156‘) AND T.CUSTOMER_ID=HEXTORAW(‘01540EAA1D8E690099261D41257815D9‘);

ORACLE优化器并没有调整查询条件字段的顺序,但是依然走了索引。走索引是符合预期的,但是我原本以后应该会改变字段顺序的,这块我有点不太理解,如果有看到这篇日志的大牛请帮忙解惑一下,谢谢。

场景六:
select * from TEST_INDEX_DEMO T WHERE
T.RECID=HEXTORAW(‘01540ED5DA7A69461D878CAE1CED2B7E‘) AND T.PRODUCT_ID=HEXTORAW(‘01540EAB83EC6900E30EAD424661D792‘);

此处没有走索引,倒是符合预期,汗~~~~

场景七:
select * from TEST_INDEX_DEMO T WHERE
T.RECID=HEXTORAW(‘01540ED5DA7A69461D878CAE1CED2B7E‘) AND T.CUSTOMER_ID=HEXTORAW(‘01540EAA1D8E690099261D41257815D9‘) AND
T.PRODUCT_ID=HEXTORAW(‘01540EAB83EC6900E30EAD424661D792‘);

此处走索引了,结果倒是符合预期。

----------------------------------------------------
结果对比及结论:


所以经此对比,我的结论是:
1、查询条件字段与复合索引字段一致的,无论顺序如何,ORACLE优化器会自动调整顺序,结论是会走索引;
2、查询条件字段与复合索引字段不一致,查询条件字段包含复合索引前导列的,可以走索引;不包含索引前导列,则不走索引;
--------------------------
所以,由此结论可以看出,在设计查询的时候,还是应该要求开发在组织SQL的时候对于第一个查询条件该用哪个字段还是需要综合考虑系统所有查询来进行设计一下的。

时间: 2024-10-29 19:07:39

复合索引使用的先决条件的相关文章

复合索引的优点和注意事项

概念:     单一索引是指索引列为一列的情况,即新建索引的语句只实施在一列上;     用户可以在多个列上建立索引,这种索引叫做复合索引(组合索引);     复合索引在数据库操作期间所需的开销更小,可以代替多个单一索引;     同时有两个概念叫做窄索引和宽索引,窄索引是指索引列为1-2列的索引,宽索引也就是索引列超过2列的索引;     设计索引的一个重要原则就是能用窄索引不用宽索引,因为窄索引往往比组合索引更有效; 使用:     创建索引     create index idx1 o

mySql的普通索引和复合索引

有关普通索引和组合索引问题: 索引分单列索引和组合索引:单列索引,即一个索引只包含单个列,一个表可以有多个单列索引,但这不是组合索引:组合索引,即一个索包含多个列.   MySQL索引类型包括:   (1)普通索引是最基本的索引,它没有任何限制.它有以下几种创建方式:   ◆创建索引   CREATE INDEX indexName ON mytable(username(length));   如果是 CHAR,VARCHAR类型,length可以小于字段实际长度;如果是BLOB和TEXT类型

Sql Server之旅——第八站 复合索引和include索引到底有多大区别?

周末终于搬进出租房了,装了宽带....才发现没网的日子...那是一个怎样的与世隔绝呀...再也受不了那样的日子了....好了,既然网 安上去了,还得继续我的这个系列. 索引和锁,这两个主题对我们开发工程师来说,非常的重要...只有理解了这两个主题,我们才能写出高质量的sql语句,在之前的博客中,我所说的 索引都是单列索引...当然数据库不可能只认单列索引,还有我这篇的复合索引,说到复合索引,可能熟悉的人又会说到include索引,那这两个索引到底 有什么区别呢,当然我也是菜鸟一枚...所以下面的

Sql Server之旅——第九站 看公司这些DBA们设计的这些复合索引

这一篇再说下索引的最后一个主题,索引覆盖,当然学习比较好的捷径是看看那些大师们设计的索引,看从中能提取些什么营养的东西,下面我们看 看数据库中一个核心的Orders表. 一:查看表的架构 <1> 先查看这个表的大概架构信息 1 --查看表的架构信息 2 SELECT c.column_id,c.name,t.name FROM sys.columns AS c 3 JOIN sys.types t 4 ON c.system_type_id=t.system_type_id 5 WHERE c

MySQL创建复合索引

在MySQL数据库中,创建复合索引的时候,不知道在创建过程中哪个列在前面,哪个列该在后面,用以下方式即可: select count(distinct first_name)/count(*) as first_name_selectivity,count(distinct last_name)/count(*) as last_name_selectivity,count(*)from actor\G mysql> select count(distinct first_name)/count

复合索引介绍

什么是复合索引 1.1           复合索引定义 索引可以包含一个.两个或更多个列.两个或更多个列上的索引被称作复合索引. 利用索引中的附加列,您可以缩小搜索的范围,但使用一个具有两列的索引不同于使用两个单独的索引.复合索引的结构与电话簿类似,人名由姓和名构成,电话簿首先按姓氏对进行排序,然后按名字对有相同姓氏的人进行排序.如果您知道姓,电话簿将非常有用:如果您知道姓和名,电话簿则更为有用,但如果您只知道名不姓,电话簿将没有用处. 所以说创建复合索引时,应该仔细考虑列的顺序.对索引中的所

SQL Server创建复合索引时,复合索引列顺序对查询的性能影响

说说复合索引 写索引的博客太多了,一直不想动手写,有一下两个原因:一是觉得有炒剩饭的嫌疑,有兄弟曾说:索引吗,只要在查询条件上建索引就行了,真的可以这么暴力吗?二来觉得,索引是个非常大的话题,很难概括出所有的情况,你不整出点新意来,倒是有抄袭照搬的嫌疑 既然写了,就写一点稍微不一样的东西出来,好了,废话打住,开搞 /* 20160814备注:今天发现一个类似的文章:http://www.cnblogs.com/fly_zj/archive/2012/08/11/2633629.html : 可以

复合索引字段的排序对搜素的影响

索引是对数据库大数据的查询优化的一种有效的手段,索引又可分为唯一索引和复合索引 单一索引是指索引列为一列的情况,即新建索引的语句只实施在一列上面. 用户可以在多个列上建立索引,这种索引叫做复合索引(组合索引).复合索引的创建方法与创建单一索引的方法完全一样.但复合索引在数据库操作期间所需的开销更小,可以代替多个单一索引.而且在表的行数远远大于索引键的数目时,使用这种方式可以明显加快表的查询速度. (1)对一张表来说,如果有一个复合索引 on (col1,col2),就没有必要同时建立一个单索引

SQL SERVER大话存储结构(4)_复合索引与包含索引

索引这块从存储结构来分,有2大类,聚集索引和非聚集索引,而非聚集索引在堆表或者在聚集索引表都会对其 键值有所影响,这块可以详细查看本系列第二篇文章:SQL SERVER大话存储结构_(2)_非聚集索引如何查找到行记录. 非聚集索引内又分为多类:单列索引.复合索引.包含索引.过滤索引等.之前文章有具体分析过非聚集索引的存储情况,但是没有对复合索引及包含索引做过多说明,本文来讲讲这两个索引. 如果转载,请注明博文来源: www.cnblogs.com/xinysu/   ,版权归 博客园 苏家小萝卜