Sql Server之旅——第三站解惑那些背了多年聚集索引的人

　　说到聚集索引，我想每个码农都明白，但是也有很多像我这样的猥程序员，只能用死记硬背来解决这个问题，什么表中只能建一个聚集索引，

然后又扯到了目录查找来帮助读者记忆。。。。问题就在这里，我们不是学文科，，，不需要去死记硬背，，，我们需要的就是能看到在眼里面的

真实东西。。。。。我们都喜欢聚集索引，因为它能够把无序的堆表记录变成有序，还玩起了B树。。。这样就把复杂度从N降低到了Log_MN。。。

这样的话逻辑读，物理读就下来了。

一：现象

1：无索引的情况

　　还是老规矩，看个例子感受下，首先我有一个Product表，里面没有任何索引，如下图：

从上图中，我悲剧的看到了，物理读是9次，也就说明走了9次硬盘，你也可以想到，走硬盘的目的是为了拿数据，逻辑读有1636次，要注意的是这里

的”次“是“页”的意思，也就是在内存中走了1636个数据页，我用dbcc ind 给你看一下，是不是有1636个表数据页。

这里有1637个数据页的原因是第一个是IAM跟踪页。

2：有聚集索引的情况

下面我在Product表中建一个product_idx_productid的聚集索引，然后再次看看io情况，如下图：

当你看到这个”逻辑读“为3次的时候，你是不是已经疯了。。。在多达1636个数据页中找到目标数据，只需3次。。。。这个在算法盲看来是不是神

仙下凡？？？当然，，，此物天上有，人间也有。。。既然有，就应该有一种非常强烈的探索欲。。。。看看这里面到底是怎么玩的。。。。。。

二：探索原理

1：探索叶子节点

　　刚才也说了，聚集索引玩的就是B树，既然是B树，那就有叶子节点和分支节点，专业术语就是度为0的为叶子节点，度>0的叫做分支节点。。。。

我想你也听说了，聚集索引是将索引列数据进行排序后放入B树，那为了让你眼见为实，我先建立一个ID无序的3条记录。

insert into Person values(2,‘bbbbb‘)
insert into Person values(3,‘ccccc‘)
insert into Person values(1,‘aaaaa‘)

然后我用dbcc ind 命令查看下3条记录在哪个数据页中，如图：

从图中可以看到，我的三条记录是放在148号数据页中的，然后我导出148号数据页，看看内容是什么。

dbcc traceon(3604)
dbcc page(Ctrip,1,148,1)

从上图中，我们看到了”数据页“中的各个槽位的指向是按照表中的实际存储记录来的，好了，下面我创建个聚集索引，看看实际数据是不是真的有序了？

create clustered index Ctrip_idx_ID on Person(ID)

不过在这里有个有趣的问题，我的148号”表数据页“哪去了？？？也是够奇葩的，换来的确实173号索引页，那为了保证数据完整性，应该是把

148号数据页的内容灌到173索引页里面去了吧？？？？没关系，验证一下。

1 dbcc traceon(3604)
2 dbcc page(Ctrip,1,173,1)

通过上面的图，有没有直观的感觉到？数据现在已经是aaaaa,bbbbb,ccccc的模式了。。。有序啦。。。。同时索引页中也保存了148号数据

页的字段值，比如ID，Name信息，拿下面的slot0槽位举例：

到此为止，我想你对叶子节点的内容有了个大概的认识，起码没有让你死记硬背了~~~

2 ：探索分支节点

　　为了让你看到分支节点，我得多灌一些数据进去，好歹要让数据撑破一个索引数据页，这样分支节点索引数据页就出来了，看下面的例子：

从图中可以看到，当我插入1000条数据的时候，已经出现了一个分支节点（120号索引数据页），三个叶子节点（173,121，126），叶子

节点的数据页内容我也说过了，现在我很好奇”分支节点“中保存着什么内容？？？我好兴奋，我要导出120号索引数据页了。。。

1 dbcc traceon(3604)
2 dbcc page(Ctrip,1,120,1)

简单分析下slot0：06000000 00ad0000 000100 的内容

00000000：叶子索引页中的最小key值（这里有点特殊，除一行记录不是保存最小值以外，其余都是的），转换为十进制就是0。

ad000000：叶子索引页的页号，转换为十进制就是173。

0100：叶子索引页的文件号，转换为十进制就是1.

不过通过分析，我们看到了，其实分支节点中保存着有两个值，一个childpage的minkey，一个childpage的pageid，同理，其他的槽位也是这样。

我们换个参数命令，让结果更直观点，记录中就是保存着”pageID“和”minKey“。

这样的话，我脑海中就有一张图出来了，不知道你现在是否有了？？？？

通过上面的分析，除了第一行记录不是保存子索引页中最小key的值外，其他记录都是提取子索引页中的最小索引键值，这一点要注意。。。

也许对sqlserver团队来说，只要判断小于449的话就直接去(1:173)数据页，小于889的直接去(1:121)数据页就可以啦。。。

当你看到这里的时候，不知道你是否已经明白，为什么表中只能有一个聚集索引呢？？？好了，乱鸡巴扯了好多，希望对你有所帮助。

时间： 2024-12-13 07:39:49

Sql Server之旅——第三站解惑那些背了多年聚集索引的人的相关文章

Sql Server之旅——第四站你必须知道的非聚集索引扫描

非聚集索引,这个是大家都非常熟悉的一个东西,有时候我们由于业务原因,sql写的非常复杂,需要join很多张表,然后就泪流满面了...这时候就有DBA或者资深的开发给你看这个猥琐的sql,通过执行计划一分析...或许就看出了不该有的表扫描...万恶之源...然后给你在关键的字段加上非聚集索引后...才发现提速比阿斯顿马丁还要快...那么一个问题来了,为什么非聚集索引能提速这么快...怎么做到的???是不是非常的好奇??? 这篇我们来解开神秘面纱. 一:现象先让我们一睹非聚集索引的真容,看看到

Sql Server之旅——第十一站简单说说sqlserver的执行计划

原文:Sql Server之旅--第十一站简单说说sqlserver的执行计划我们知道sql在底层的执行给我们上层人员开了一个窗口,那就是执行计划,有了执行计划之后,我们就清楚了那些烂sql是怎么执行的,这样就可以方便的找到sql的缺陷和优化点. 一:执行计划生成过程说到执行计划,首先要知道的是执行计划大概生成的过程,这样就可以做到就心中有数了,下面我画下简图: 1. 分析过程这三个比较容易理解,首先我们要保证sql的语法不能错误,select和join的表是必须存在的,以及你是有执行

Sql Server之旅——第七站为什么都说状态少的字段不能建索引

我们在学sqlserver的时候,大多教科书和前辈们都说状态少的字段不要建索引,由此带来的开销还不如不建索引,但是这句话有多少人真的知道, 或者说有多少人真的对此有比较深刻的理解,而不是听别人道听途说...这样记得快,忘记的也不慢...这篇我来分析一下这句话到底有几个意思. 一:现象首先我们还是用测试数据来发现问题,我先建立一个Person,有5个字段,建表sql如下: DROP TABLE dbo.Person CREATE TABLE Person(ID INT PRIMARY KEY I

Sql Server之旅——第八站复合索引和include索引到底有多大区别？

周末终于搬进出租房了,装了宽带....才发现没网的日子...那是一个怎样的与世隔绝呀...再也受不了那样的日子了....好了,既然网安上去了,还得继续我的这个系列. 索引和锁,这两个主题对我们开发工程师来说,非常的重要...只有理解了这两个主题,我们才能写出高质量的sql语句,在之前的博客中,我所说的索引都是单列索引...当然数据库不可能只认单列索引,还有我这篇的复合索引,说到复合索引,可能熟悉的人又会说到include索引,那这两个索引到底有什么区别呢,当然我也是菜鸟一枚...所以下面的

Sql Server之旅——第五站确实不得不说的DBCC命令

今天研发中心办年会,晚上就是各自部门聚餐了,我个人喜欢喝干红,在干红中你可以体味到那种酸甜苦辣...人生何尝不是这样呢???正好 ceo从美国带了干红回来,然后我就顺道开心的过了把瘾....一个字...爽....喝着有点多...到现在头还疼....回来地铁上想这个周末忙着找房子,书一点都没看,也没在博客上接着忽悠,想起了上篇博客有个哥们说普及普及DBCC,虽然有点迷迷糊糊的...看能不能写出点新花样....不管学什么语言,还是数据库,你得看的比人家深一层...最可悲的就是停留的在表层,这样每

Sql Server之旅——第十站看看DML操作对索引的影响

我们都知道建索引是需要谨慎的,当只有利大于弊的时候才适合建,我们也知道建索引是需要维护成本的,这个维护也就在于DML操作了, 下面我们具体看看到底DML对索引都有哪些内幕.... 一:delete操作现在我们已经知道,索引都是以B树的形式存在的,既然是B树,我们就要看看他们的叶子节点和分支结点,先准备点测试数据,如下图: CREATE TABLE Person(ID INT,NAME CHAR(200)) CREATE INDEX idx_Name ON Person(NAME) DECLAR

Sql Server之旅——第六站使用winHex利器加深理解数据页

这篇我来介绍一个winhex利器,这个工具网上有介绍,用途大着呢,可以用来玩数据修复,恢复删除文件等等....它能够将一个file解析成 hex形式,这样你就可以对hex进行修改,然后你就可以看到修复后的结果,为什么要在sqlserver系列中说这个呢???很简单呀,sqlserver的DB本质上也是一个mdf文件,对吧,既然是文件,我就可以利用winhex对它进行随意的修改,然后你也知道sqlserver的数据都是以数据页的形式封装的, 那我就可以修改它的数据页,对不对,这样我就可以随便改变

Sql Server之旅——第十三站对锁的初步认识

终于这个系列快结束了,马上又要过年了,没什么心情写博客...作为一个开发人员,锁机制也是我们程序员必须掌握的东西,很久之前在学习锁的时候,都是教科书上怎么说,然后我怎么背,缺少一个工具让我们眼见为实...如果这样的话,学习一个东西就很容易忘记... 因为这些都是你背诵过来的...这篇的话我就来分享一个工具来帮助我们学习锁. 一:到底都有哪些锁学习锁之前,必须要知道锁大概有几种???通常情况下作为码农我们只需知道如下几个锁即可... 1.S(Share)锁为了方便理解,我们可以直接这么认为,

Sql Server之旅——第十四站深入的探讨锁机制

原文:Sql Server之旅--第十四站深入的探讨锁机制上一篇我只是做了一个堆表让大家初步的认识到锁的痉挛状态,但是在现实世界上并没有这么简单的事情,起码我的表不会没有索引对吧,,,还有就是我的表一定会有很多的连接过来,10:1的读写,很多码农可能都会遇到类似神乎其神的死锁,卡住,读不出来,插不进入等等神仙的事情导致性能低下,这篇我们一起来探讨下. 一: 当select遇到性能低下的update会怎么样? 1. 还是使用原始的person表,插入6条数据,由于是4000字节,所以两条数

Sql Server之旅——第三站 解惑那些背了多年聚集索引的人

Sql Server之旅——第三站 解惑那些背了多年聚集索引的人的相关文章

Sql Server之旅——第三站解惑那些背了多年聚集索引的人

Sql Server之旅——第三站解惑那些背了多年聚集索引的人的相关文章