金万城平台SQL Server索引的原理深入解析扣892118

1.1 聚集索引
表的数据是存储在数据页中（数据页的PageType标记为1），SqlServer一页是8k，存满一页就开辟下一页存储。如果表有聚集索引，那么一笔一笔物理数据就是按聚集索引字段的大小升/降排序存储在页中。当对聚集索引字段更新或中间插入/删除数据时，都会导致表数据移动（造成性能一定影响），因为它要保持升/降排序。

注意，主键只是默认是聚集索引，它也可以设置为非聚集索引，也可以在非主键字段上设置为聚集索引，全表只能有一个聚集索引。
一个优秀的聚集索引字段一般包含以下4个特性：
(A).自增长
总是在末尾增加记录，减少分页和索引碎片。
(B).不被更改
减少数据移动。
(C).唯一性
唯一性是任何索引最理想的特性，可以明确索引键值在排序中的位置。
更重要的是，索引键指唯一的话，它在每条记录里才可以正确指向源数据行RID。如果聚集索引键值不唯一，SqlServer就需要内部生成uniquifier 列组合当作聚集键保证“键值”唯一性；如果非聚集索引键值不唯一，就会增加RID列（聚集索引键或者堆表中的行指针）保证“键值”唯一性。
思考（可略过）：索引“键值”在非叶子节点也有保证唯一性，原因应该是为了明确索引记录在非叶子节点中的位置。比如有个非聚集索引字段Name2，表中有很多Name2=‘a‘的记录，导致Name2=‘a‘在非叶子节点上有多条索引记录（节点），这时候再insert一笔Name2=‘a‘的记录时，就可以根据非叶子节点的RID和新增记录的RID很快确定要insert到哪个索引记录（节点）上，如果没有非叶子节点的RID，那得遍历到所有Name2=‘a‘的叶子节点才能确定位置。另外，当我们select * from Table1 where Name2<=‘a‘时，返回的数据是按非聚集索引Name2和RID排序的，很好理解返回的数据就是按这边索引存储的顺序排序的。这是这条sql查询时有用到Name2索引的结果，如果数据库查询计划因“临界点”问题选择直接表数据扫描，那返回的数据默认就是按表数据的顺序排序的。
为了“键值”唯一性，对于聚集索引，uniquifier 列只在索引值重复时增加。对于非聚集索引，如果创建索引时没定义唯一，RID会在所有记录增加，就算索引值是唯一的；如果创建索引时定义唯一，RID只在叶子层增加，用于查找源数据行，即书签查找操作。
(D).字段长度小
聚集索引键长度越小，一页索引页就可以容纳更多索引记录，进而减少索引B树结构的深度。例如，一个百万记录的表有一个int聚集索引，可能只需要3层的B树结构。如果把聚集索引定义在更宽的列（比如uniqueidentifier列需要16 字节），那么索引的深度会增加到4层。任何聚集索引查找需要4个I/O操作（确切的说是4个逻辑读），原先只要3个I/O操作。
同样，非聚集索引里会包含聚集索引键值，聚集索引键长度越小非聚集索引记录也就越小，一页索引页就可以容纳更多索引记录。

原文地址：http://blog.51cto.com/13922809/2159755

时间： 2024-11-07 23:16:13

金万城平台SQL Server索引的原理深入解析扣892118

金万城平台SQL Server索引的原理深入解析扣892118的相关文章

金万城平台扣892118码是数据系统中的基本概念

金万城主管数据库系统是怎样降低冗余度的？

SQL Server索引设计 <第五篇>

SQL Server 索引之书签查找 <第十一篇>

SQL Server 索引结构及其使用（一）

SQL Server 索引结构及其使用

sql server 索引总结三

SQL Server 索引维护：系统常见的索引问题

SQL Server索引的维护 - 索引碎片、填充因子 <第三篇>