【SQL进阶】03.执行计划之旅1 - 初探

听到大牛们说执行计划,总是很惶恐,是对知识的缺乏的惶恐,所以必须得学习执行计划,以减少对这一块知识的惶恐,下面是对执行计划的第一讲-理解执行计划。

本系列【T-SQL】主要是针对T-SQL的总结。

SQL基础

【T-SQL基础】01.单表查询-几道sql查询题

【T-SQL基础】02.联接查询

【T-SQL基础】03.子查询

【T-SQL基础】04.表表达式-上篇

【T-SQL基础】04.表表达式-下篇

【T-SQL基础】05.集合运算

【T-SQL基础】06.透视、逆透视、分组集

【T-SQL基础】07.数据修改

【T-SQL基础】08.30分钟全面解析-SQL事务+隔离级别+阻塞+死锁(推荐 +165)

【T-SQL基础】09.可编程对象

SQL进阶

【SQL进阶】01.好用的SQL TVP~~独家赠送[增-删-改-查]的例子

【SQL进阶】02.理解SQL查询的底层原理(推荐 +5)

【SQL进阶】03.执行计划之旅1 - 初探 (最新)

SQL性能调优

【SQL性能调优】01.TempDB的使用和性能问题

持续更新......欢迎关注我!

一、为什么需要执行计划?

(1)帮助分析

当我们想要去分析SQL语句存在很慢时,需要有一个分析工具帮助我们分析SQL语句中哪些地方存在性能问题,而这个分析工具就是执行计划,看懂执行计划就能知道哪些地方有性能问题,然后结合自己已有的SQL知识分析为什么这些地方有性能问题,进而尝试提出解决方案,并测试自己的方案是否能提高性能,以及方案是否合理。

(2)获取其他信息

a.哪些索引被用在查询中

b.数据是怎样关联起来的

c.数据是怎样检索的

d.为什么SQL Server没有使用这些索引

e.SQL语句的执行顺序

二、什么是执行计划?

SQL语句执行之前,需要有一个执行的方案,而这个方案是由查询优化器(查询分析器)产生的,并且是高效的、开销最小的方案,这就是执行计划。不知道查询优化器的可以看我写之前写的一篇博客:

【T-SQL进阶】02.理解SQL查询的底层原理

三、如何显示执行计划?

执行计划有三种格式:图形化执行计划,文本化执行计划,XML格式的执行计划。

(1)图形化执行计划

优点:可视性好。

a.估计的执行计划

可以通过鼠标点击图标显示估计的执行计划或者通过快捷键Ctrl+L显示估计执行计划。预估执行计划不会真正执行,只是预估出来的执行计划。

b.实际的执行计划

单击实际的执行计划图标,该图标处于选中状态,然后执行SQL语句,将会显示实际执行的执行计划。

(2)文本化执行计划

用独立的行来代表每一个迭代器。使用竖线(符号“|”)来代表查询树中迭代器之间的父子关系。数据都是从子迭代器流向父迭代器。

优点:和图形计划比较,文本执行计划更容易保存、处理、搜索和比较。

--显示完整的预估执行计划信息
SET SHOWPLAN_TEXT ON
GO
--显示预估执行计划的有限信息,可以用osql.exe等工具分析
SET SHOWPLAN_ALL ON
GO
--显示完整的实际执行计划信息
SET STATISTICS PROFILE ON
GO

总结:

(3)XML执行计划

优点:三种执行计划中最详细的。图形执行计划可以保存为扩展名为.sqlplan的XML格式的计划文件,打开此文件将会以图形化的执行计划展示。

--显示预估执行计划
SET SHOWPLAN_XML ON
GO
--显示实际计划的XML格式数据
SET STATISTICS XML ON
GO

总结

四、如何分析执行计划?

下面分析三种情况的执行计划:

1.堆表

2.聚集索引

3.非聚集索引

结构 扫描 查找 书签查找
堆表 表扫描 没有这种情况 RID 查找
聚集索引 聚集索引扫描 聚集索引查找 没有这种情况
非聚集索引 如果用到了索引,则是索引扫描 索引查找 Key 查找

关于表扫描的那些事:

  • 没有索引的表称作堆表,查找匹配行用的是表扫描。
  • 如果出现表扫描操作,则证明这个表上一定没有聚集索引。

关于索引查找的那些事:

假设[列1]上有一个单列索引,可以使用这个索引查找下面这些谓词:

1.[列1] = 1.23

2.[列1] > 1.23

3.[列1] BETWEEN 1 AND 100

4.[列1] LIKE ‘abc%‘

5.[列1] IN (1,3,7,10)

  不能使用这个索引对下列这些谓词进行查找:

1.ABS[列1] = 1

2.[列1] + 10 > 12

3.[列1] LIKE ‘%abc‘

关于非聚集索引的那些事:

  1. 如果只有非聚集索引时,非聚集索引不包含查询列时,则SQL查询优化器选择非聚集索引扫描。
  2. 只有非聚集索引时,非聚集索引不包含过滤条件列时,则选择表扫描。
  3. 非聚集索引具有独立于数据行的结构。 非聚集索引包含非聚集索引键值,并且每个键值项都有指向包含该键值的数据行的指针。
  4. 从非聚集索引中的索引行指向数据行的指针称为行定位器。 行定位器的结构取决于数据页是存储在堆中还是聚集表中。 对于堆,行定位器是指向行的指针。 对于聚集表,行定位器是聚集索引键。
  5. 您可以向非聚集索引的叶级添加非键列(包含列)以跳过现有的索引键限制(900 字节和 16 键列),并执行完整范围内的索引查询。

关于聚集索引的那些事:

1. 如果表上有聚集索引,则扫描称作聚集索引扫描,查找称作聚集索引查找;

2. 聚集索引扫描和表扫描的性能没多大差异;

3.聚集索引根据数据行的键值在表或视图中排序和存储这些数据行。

4.索引定义中包含聚集索引列。

5.每个表只能有一个聚集索引,因为数据行本身只能按一个顺序排序。

6.只有当表包含聚集索引时,表中的数据行才按排序顺序存储。 如果表具有聚集索引,则该表称为聚集表。如果表没有聚集索引,则其数据行存储在一个称为堆的无序结构中。

7.加了聚集索引不一定能提高性能,有些情况下,性能可能不如表扫描;

8.聚集索引就是表本身。表有多少行和多少列,聚集索引就有多少行和和多少列。

9.单表查询中,过滤条件中有聚集索引列,且能用这个索引查找过滤条件中的谓词,则是聚集索引查找,过滤条件中没有聚集索引列则是聚集索引扫描。

(1)没有索引的情况

创建myOrder表

USE [Test]
GO
 
CREATE TABLE [dbo].[myOrder](
	[id] [int] NOT NULL,
	[customer] [nvarchar](100) NOT NULL
) ON [PRIMARY]
 
GO

myOrder只有两列id,customer,这两列上面都没有索引。

SELECT [id]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] = ‘ddd‘

下面是执行计划:

customer列上面没有索引,SQL Server需要读取myOrder表的每一行来判断customer=‘ddd‘,如果结果为true,则返回此行。

查询的示例图如下,customer=ddd 存在三条记录。

注意:

1.扫描及查找是SQL Server用来从表和索引中读取数据的迭代器;

2.扫描用来处理整个表或索引的全部分支;

3.查找是在谓词基础上有效返回索引中一个或多个范围中的行。

(2)有非聚集索引的情况

在id上创建非聚集索引

USE [Test]
GO
 
--删除索引dbo.myOrder.ID_NON_INDEX
DROP INDEX dbo.myOrder.ID_NON_INDEX
 
CREATE NONCLUSTERED INDEX [ID_NON_INDEX] ON [dbo].[myOrder]
(
	[id] ASC
)WITH (PAD_INDEX  = OFF, STATISTICS_NORECOMPUTE  = OFF, SORT_IN_TEMPDB = OFF, IGNORE_DUP_KEY = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = ON) ON [PRIMARY]
GO

1.查询条件的列上没有非聚集索引,查询列上没有非聚集索引->表扫描

--id列上有索引,customer列上没有索引,查询条件中用的是customer=‘ddd‘进行过滤。
--由于customer列上没有索引,所以需要进行表扫描来找到符合customer=‘ddd‘的行。
SELECT [id]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] = ‘ddd‘

SELECT [customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] = ‘ddd‘

SELECT [id],[customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] = ‘ddd‘

 SELECT [id]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2 AND [customer] =‘ddd‘

SELECT [id],[customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2 AND [customer] =‘ddd‘

2.查询条件的列上有非聚集索引,查询列上没有非聚集索引->表扫描

--id列上有索引,customer列上没有索引,查询条件中用的是id=2进行过滤。
--SELECT查询需要返回customer列,由于customer列上没有索引,且索引[ID_NON_INDEX]不包含customer列,
--即使用非聚集索引扫描找到了符合过滤条件id=2的索引分支,但是只能在该索引分支上面拿到id列的值,因为该索引分支只包含了id列,其他列的值拿不到。
--所以还是需要进行表扫描来找到符合条件的行,然后获取该行的customer列的值。
--这里有个疑问:为什么找到索引分支后,不能继续找到对应的行,然后拿到这行的customer列??

3.查询条件的列上有非聚集索引,查询列上有非聚集索引->索引查找

--id列上有索引,customer列上没有索引,查询条件中用的是id=2进行过滤。
--SELECT查询需要返回id列,使用非聚集索引扫描找到了符合过滤条件id=2的索引分支,在找到的索引分支上拿到id列的值。
SELECT [id]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2

3)有聚集索引的情况

1.查询条件的列上没有聚集索引->聚集索引扫描

--
--id列上有聚集索引,customer列上没有索引,查询条件中用的是customer=‘ddd‘进行过滤。
--由于customer列上没有索引,所以需要进行扫描来找到符合customer=‘ddd‘的行。
--只要有聚集索引,则扫描就是聚集索引扫描。聚集索引和表扫描的性能基本上一样。
SELECT [id]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] = ‘ddd‘

SELECT [customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] = ‘ddd‘

SELECT [id],[customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] = ‘ddd‘

  

2.查询条件的列上有聚集索引->聚集索引查找

--id列上有索引,customer列上没有索引,查询条件中用的是id=2进行过滤。
--用聚集索引查找到了id=2的行,由于表中的行就是按照id列来排序的,所以找到了这一行,
--也就能找到这一行的所有列,所以能够拿到customer列。所以是聚集索引扫描。
 SELECT [customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2

SELECT [id]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2

 SELECT [id],[customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2

  

3.查询条件中,有一列有聚集索引,另一列没有聚集索引->聚集索引查找

--id列上有索引,customer列上没有索引,查询条件中用的是[id] = 2,[customer] =‘ddd‘进行过滤。
--当过滤条件中有一个可以根据聚集索引来查找时,先用聚集索引来找到匹配的行([id] = 2),然后再在过滤出来的行中筛选处符合[customer] =‘ddd‘的行。
--所以是聚集索引查找。
--疑问:为什么第二步筛选操作在执行计划图中没有体现??这个地方我想到的是拿到id=2的匹配行后,直接舍弃掉不符合条件[customer] =‘ddd‘的行,这个舍弃动作就没有直接体现出来。
  SELECT [id]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2 AND [customer] =‘ddd‘

  SELECT [id],[customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [id] = 2 AND [customer] =‘ddd‘

  SELECT [id],[customer]
  FROM [Test].[dbo].[myOrder]
  WHERE [customer] =‘3333‘ AND [id] = 2
时间: 2024-08-01 19:56:43

【SQL进阶】03.执行计划之旅1 - 初探的相关文章

【MS SQL】通过执行计划来分析SQL性能

如何知道一句SQL语句的执行效率呢,只知道下面3种: 1.通过SQL语句执行时磁盘的活动量(IO)信息来分析:SET STATISTICS IO ON (开启) / SET STATISTICS IO OFF (关闭) 2.通过SQL语句执行时语法分析.编译以及执行所消耗的时间:SET STATISTICS TIME ON (开启) / SET STATISTICS TIME OFF (关闭) 3.通过执行计划查看:Ctrl + L -------------------------------

如何通过outline为SQL语句指定执行计划

创建测试表 以用户jyu连接,创建测试表 SQL> conn jyu/jyu; Connected. SQL> create table t (id number, name varchar2(100)); Table created. SQL> insert into t select rownum,object_name from dba_objects; 47391 rows created. SQL> commit; Commit complete. 创建索引 SQL>

了解Sql Server的执行计划

前一篇总结了Sql Server Profiler,它主要用来监控数据库,并跟踪生成的sql语句.但是只拿到生成的sql语句没有什么用,我们可以利用这些sql语句,然后结合执行计划来分析sql语句的性能问题,这才是我们的最终目的,那么如何使用执行计划呢?我准备从以下几点来总结. 如何启动执行计划 执行计划结果要看什么 Sql Server的五种查找方式 查看更具体的执行过程 如何启动执行计划 运行一条sql,并且在工具栏中选中'Include Actual Execution Plan'按钮,此

SQL SERVER 2012 执行计划走嵌套循环导致性能问题的案例

原文:SQL SERVER 2012 执行计划走嵌套循环导致性能问题的案例 开发人员遇到一个及其诡异的的SQL性能问题,这段完整SQL语句如下所示: declare @UserId             INT declare @PSANo              VARCHAR(200) declare @ShipMode           VARCHAR(10) declare @CY_FLAG            VARCHAR(1) declare @PO            

printsql.sql 打印对应spid或sid所对应的sql以及其执行计划

/* 打印对应spid或sid所对应的sql以及其执行计划 */ CREATE OR REPLACE PROCEDURE PRINTSQL (i_n_id        IN NUMBER, i_vc_idtype   IN VARCHAR2) IS /* 功能: 打印对应spid或sid所对应的sql以及其执行计划 作者: 老熊,dbsnake 创建日期:2010-11-12 输入参数: i_n_id: 输入的spid或sid i_vc_idtype : 输入的ID的类型,'SPID'表示输入

有多少办法可以查看一个Oracle SQL语句的执行计划 - SQL EXECUTE PLAN

待补充,如果要做一个SQL自动审核工具,从哪里可以下手? 1.通过SQL*PLUS工具里的EXPLAIN PLAN FOR判断,利用DBMS_XPLAN.DISPLAY显示. 2.通过SQL*PLUS工具里的 SET AUTOTRACE命令显示 3.SQL_TRACE,在数据库全局(有性能问题,基本上是废的选项),或者对当前Session定义SQL_TRACE,或者利用DBMS_SYSTEM.SET_SQL_TRACE_IN_SESSION获取其他Session的SQL_TRACE.利用TKPR

Sql Server中执行计划的缓存机制

Sql查询过程 当执行一个Sql语句或者存储过程时, Sql Server的大致过程是 1. 对查询语句进行分析,将其生成逻辑单元,并进行基本的语法检查 2. 生成查询树(会将查询语句中所有操作转换为对基表的操作,比如将视图转换为基表查询) 3. 生成执行计划(针对查询树会生成很多不同的执行计划) 4. 查询优化器基于每个执行计划的查询成本和数据库中的统计信息,选择一个最优执行计划 5. 最优执行计划会被缓存在数据库的缓存池中.当再次执行相同Sql语句时,缓存的执行计划会被直接使用.这样可以提高

性能测试四十一:sql案例之慢sql配置、执行计划和索引

MYSQL 慢查询使用方法MYSQL慢查询介绍分析MySQL语句查询性能的问题时候,可以在MySQL记录中查询超过指定时间的语句,我们将超过指定时间的SQL语句查询称为“慢查询”.MYSQL自带的慢查询分析工具mysqldumpslow可对慢查询日志进行分析:主要功能是, 统计sql的执行信息,其中包括 : 出现次数(Count),  执行最长时间(Time),  累计总耗费时间(Time),  等待锁的时间(Lock),  发送给客户端的行总数(Rows),  扫描的行总数(Rows), 用户

添加索引后SQL消耗量在执行计划中的变化

不同索引的执行效率也是不一样的,下面比较三条SQL语句在正常查询与建立普通索引与位图索引后的CPU消耗量的变化,目的为了是加强对索引的理解与运用 实验步骤: 1.创建有特点的大数据表.为了保证索引产生前后,查询效果的正确比对,应建立一个存在大量数据的测试表.这个测试表的数据来源于SYS模式下的all_objects视图,其中包括本数据库实例中的全部对象的基本描述,具体包括对象的所有者.对象名称.创建日期等信息.创建测试表的具体过程: 创建大数据表,sys用户下的all_objects表就比较适合