SqlServer索引使用及维护

在应用系统中,尤其在联机事物处理系统中,对数据查询及处理速度已成为衡量应用系统的标准。

而采用索引来加快数据处理速度也成为广大数据库用户所接受的优化方法。

在良好的数据库设计基础上,能够有效地索引是SQL Server取得高性能的基础,SQL Server采用基于代价的优化模型,他对每一个提交的有关表的查询,决定是否使用索引或用哪一个索引。因为查询执行的大部门开销是磁盘I/O,使用索引提高性能的一个主要目标就是避免全表扫描,因为全表扫描需要从磁盘上读表的每一个数据页,如果有索引指向数据值,则查询只需要读几次磁盘就能了。所以如果建立了合理的索引,优化器就能利用索引加速数据的查询过程。不过,索引并不总是提高系统的性能,在增、删、改操作中索引的存在会增加一定的工作量,因此,在适当的地方增加适当的索引并从不合理的地方删除次优的索引,将有助于优化那些性能较差的SQL Server应用。实践表明,合理的索引设计是建立在对各种查询的分析和预测上的,只有正确地使索引和程式结合起来,才能产生最佳的优化方案。本文就是SQL Server索引的性能问题进行了一些分析和实践。

一、聚集索引(clustered indexes)的使用

聚集索引是一种对磁盘上实际数据重新组织以按指定的一个或多个列的值排序。由于聚簇索引的索引页面指针指向数据页面,所以使用聚簇索引查找数据几乎总是比使用非聚簇索引快。

每张表只能建立一个聚簇索引,并且建聚簇索引需要至少相当该表120%的附加空间,以存放该表的副本和索引中间页。建立聚簇索引的思想是:

1. 大多数表都应该有聚簇索引或使用分区来降低对表尾页的竞争,在一个高事务的环境中,对最后一页的封锁严重影响系统吞吐量。

2. 在聚簇索引下,数据在物理上按顺序排在数据页上,重复值也排在一起,因而在那些包含范围检查(between、<=、>、>=)或使用group by或order by的查询时,一旦找到具有范围中第一个键值的行,具有后续索引值的行确保物理上毗连在一起而不必进一步搜索,避免大范围扫描,能大大提高查询。

3. 在一个频繁发生插入操作的表上建立聚簇索引时,不要建立在具有单调上升值得列(如IDENTITY)上,否则会经常一起封锁冲突。

4. 在聚簇索引中不要包含经常修改的列值上,因为码值修改后,数据行必须移动到新的位置。

5. 选择聚簇索引应用基于where子句和连接操作的类型。

聚簇索引的候选列是:

1. 按范围存取的列,如Pro_Order>100 and Pri_Order<200。

2. 在Group by 或 Order by 中使用的列。

3. 在连接中使用的列

二、非聚簇索引(noclustered indexes)的使用

SQL Server缺省情况下建立的索引是非聚簇索引,由于非聚簇索引不重新组织表中的数据,而是对每一行存储索引列值并用一个指针指向数据的所在页面。换句话说非聚簇索引具有在索引结构和数据本身之间的一个额外级。一个表如果没有聚簇索引时,可有250个非聚簇索引提供访问数据的不同排序顺序。在建立非聚簇索引时,要权衡索引对查询速度的加快和降低修改速度之间的利弊。另外还要考虑这些问题:

1. 索引需要使用多少空间。

2. 合适的列是否稳定。

3. 索引键是怎么选择的,扫描效果。

4. 是否有许多重复值

对更新频繁的表来说,表上的非聚簇索引比聚簇索引和根本没有索引需要更多的额外开销。对移到新页的每一行而言,指向该数据的每个非聚簇索引的页级行业必须更新,有时还需要索引页的分理。从一个页面删除数据的进程也会有类似的开销,另外,删除进程还必须把数据移到页面上部,以确保数据的连续性。所以,建立非聚簇索引要非常慎重。非聚簇索引常被用在一下情况:

1. 某列常用于集合函数如SUM()。

2. 某列常用于join,order by,group by。

3. 查询出的数据不超过表中数据量的20%。

三、索引的选择技术

1. 主键时常作为where子句的条件,应在表的主键上建立聚簇索引,尤其经常用其连接的时候。

2. 有大量重复值且经常有范围查询和排序、分组发生的列,或非常频繁地访问的列,可考虑建立聚簇索引。

3. 如果知道索引键的所有制都是唯一的,那么确保把索引定义成唯一索引。

4. 在一个经常做插入操作的表上建立索引时,使用fillfactor(填充因子)来减少页分裂,同时提高并发度降低死锁的发生。如果在只读表上建立索引,则能把fillfactor置为100

5. 在选择索引键时,设法选择那些采用小数据类型的列作为键,以使每个索引页能够容纳尽可能多的索引键和指针,通过这种方式,可使一个查询必须便利的索引页面降到最小。此外,尽可能地使用整数为键值,因为他能够提供比所有数据类型都快的方位速度。

四、索引的维护

上面讲到,某些不适合的索引影响到SQL Server的性能,随着应用系统的运行,数据不断地发生变化,当数据变化达到某一个程度时将会影响到索引的使用。这时需要用户自己来维护索引。索引的维护包括:

1. 重建索引

随着数据行的插入、删除、和数据页的分裂,有些索引页可能只包含几页数据,另外应用在执行大块I/O的时候,重建非聚簇索引能降低分片,维护大块I/O的效率。重建索引实际上是重新组织B-树空间。在下面的情况下需要重建索引:

(1)、数据和使用模式大幅度变化。

(2)、排序的顺序发生改动。

(3)、要进行大量插入操作或已完成。

(4)、使用大块I/O的查询的磁盘读此书比预料的要多。

(5)、大量数据修改,使得数据页和索引页没有充分使用而导致空间的使用超出估算。

(6)、dbcc检查出索引的问题。

当重建聚簇索引时,这张表的所有非聚簇索引将被重建。

2、索引统计信息的更新

当在一个包含数据的表上创建索引的时候,SQL Server会创建分布数据页来存放有关索引的两种统计信息:分布表和密度表。优化器利用这个页来判断该索引对某个特定查询是否有用。但这个统计信息并不动态地重新计算。这意味着,当表的数据改动后,统计信息由可能是过时的,从而影响优化器追求最优工作的目标。因此,在下面情况下运行update statitics命令:

(1)、数据行的插入和删除修改了数据的分布。

(2)、对用truncate table删除数据的表上增加数据行。

(3)、修改索引列的值。

时间: 2024-10-09 00:59:28

SqlServer索引使用及维护的相关文章

SQLSERVER 索引维护

SQLSERVER 索引维护 2012-03-08 00:30:09|  分类: 默认分类 |  标签:sql  sqlserver  索引  |举报|字号 订阅 Pages & Extents(页和扩展盘区)SQL Server 2000最基本的数据存储单元是data page,1个8K的存储空间.在分配存储空间时,SQL Server 2000并不是每次分配1个page,基本的存储空间分配单元是8个page的连续空间,称为extent.关于SQL Server 2000的page.exten

SQLServer索引

SQLServer索引1.聚集和非聚集索引聚集索引:根据聚集索引进行排序,非聚集索引因为不根据索引键排序,所以聚集索引比非聚集索引快(一个表只有一个聚集索引)2.唯一索引和非唯一索引唯一索引时值不能重复 建立索引的原则:1) 定义主键的数据列一定要建立索引.2) 定义有外键的数据列一定要建立索引.3) 对于经常查询的数据列最好建立索引.4) 对于需要在指定范围内的快速或频繁查询的数据列;5) 经常用在WHERE子句中的数据列.6) 经常出现在关键字order by.group by.distin

SQL Server 索引知识-应用,维护

创建聚集索引 a索引键最好唯一(如果不唯一会隐形建立uniquier列(4字节)确保唯一,也就是这列都会复制到所有非聚集索引中) b聚集索引列所占空间应尽量小(否则也会使非聚集索引的空间变大) c聚集索引应固定,不能随便改动(否则会引起分页,碎片,非聚集索引被迫修改等一些列问题) d聚集索引键一般与主键(primary key)分开(基于方便业务调整,如业务逻辑存储数据与clustered index key一致且不会改变,则主键可为聚集索引) 应用实例: 选择聚集键时,尽量避免因插入引起的分页

SQL Server 索引的自动维护 &lt;第十三篇&gt;

在有大量事务的数据库中,表和索引随着时间的推移而碎片化.因此,为了增进性能,应该定期检查表和索引的碎片,并对具有大量碎片的进行整理. 1.确定当前数据库中所有需要分析碎片的表. 2.确定所有表和索引的碎片. 3.考虑一下因素以确定需要进行碎片整理的表和索引. 高的碎片水平-avg_fragmentation_in_percent大于20%: 不是非常小的表或索引-也就是page_count大于8的: 4.整理具有大量碎片的表和索引: 这里给出一个样板SQL存储过程,它执行以下操作: 遍历系统上的

(转)SqlServer索引及优化详解(1)

(一)深入浅出理解索引结构 ??????? 实际上,您可以把索引理解为一种特殊的目录.微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引.簇集索引)和非聚集索引(nonclustered index,也称非聚类索引.非簇集索引).下面,我们举例来说明一下聚集索引和非聚集索引的区别: ??????? 其实,我们的汉语字典的正文本身就是一个聚集索引.比如,我们要查"安"字,就会很自然地翻开字典的前几页,因为"安"的拼音是&q

Lucene-Query的使用及其索引库的维护

1 Lucene的Query的使用 Lucene是使用Query对象执行查询的, 由Query对象生成查询的语法. 如bookName:java, 表示搜索bookName域中包含java的文档数据. 1.1 Query对象的两种创建方法 1.1.1 使用Query子类对象 1.1.1.1 常用的Query子类对象 子类对象 说明 TermQuery 不使用分析器, 对关键词做精确匹配搜索. 如:订单编号.身份证号 NumericRangeQuery 数字范围查询, 比如: 图书价格大于80,

sqlserver 索引优化 CPU占用过高 执行分析 服务器检查

原文:sqlserver 索引优化 CPU占用过高 执行分析 服务器检查 1. 管理公司一台服务器,上面放的东西挺多的.有一天有个哥们告诉我现在程序卡的厉害.我给他说,是时候读点优化的书了.别一天到晚没个正形,现在写的程序卡的跑不动.他说我本地 是好好的,跑的很快.我说别扯那么多没用的,服务器不比你的本子强得多.待洒家上去看看.不看不知道一看吓一跳,CPU占用在95上下.开个程序是不卡,可整点有些时间是卡的一匹.这就令人很难受了. 本来服务器上也没有什么,就一个网站和几个数据库.那一个个分析吧,

认识SQLServer索引以及单列索引和多列索引的不同

一.索引的概念 索引的用途:我们对数据查询及处理速度已成为衡量应用系统成败的标准,而采用索引来加快数据处理速度通常是最普遍采用的优化方法. 索引是什么:数据库中的索引类似于一本书的目录,在一本书中使用目录可以快速找到你想要的信息,而不需要读完全书.在数据库中,数据库程序使用索引可以重啊到表中的数据,而不必扫描整个表.书中的目录是一个字词以及各字词所在的页码列表,数据库中的索引是表中的值以及各值存储位置的列表. 索引的利弊:查询执行的大部分开销是I/O,使用索引提高性能的一个主要目标是避免全表扫描

[转]SqlServer索引的原理与应用

索引的概念 索引的用途:我们对数据查询及处理速度已成为衡量应用系统成败的标准,而采用索引来加快数据处理速度通常是最普遍采用的优化方法. 索引是什么:数据库中的索引类似于一本书的目录,在一本书中使用目录可以快速找到你想要的信息,而不需要读完全书.在数据库中,数据库程序使用索引可以重啊到表中的数据,而不必扫描整个表.书中的目录是一个字词以及各字词所在的页码列表,数据库中的索引是表中的值以及各值存储位置的列表. 索引的利弊:查询执行的大部分开销是I/O,使用索引提高性能的一个主要目标是避免全表扫描,因