SQLServer中使用扩展事件获取Session级别的等待信息以及SQLServer 2016中Session级别等待信息的增强

本文出处:http://www.cnblogs.com/wy123/p/6835939.html

什么是等待

简单说明一下什么是等待:
当应用程序对SQL Server发起一个Session请求的时候,这个Session请求在数据库中执行的过程中会申请其所需要的资源,
比如可能会申请内存资源,表上的锁资源,物理IO资源,网络资源等等,
如果当前Session运行过程中需要申请的某些资源无法立即得到满足,就会产生等待。
SQL Server会以不用的方式来展现这个等待信息,比活动Session的等待信息,实例级的等待信息等等。
SQL Server中,等待事件是作为DBA进行TroubleShooting的重要参考信息之一,SQL Server中可以通过多中方式来获取等待信息。

但是对于SQL Server 2016之前的版本来说,不管是活动Session级别的等待和实例级的等待,参考意义都有限,
更多的时候是想要更加详细的且可以事后分析的等待,这就需要收集那些曾经已执行过的Session产生的等待信息,也就是特定Session等待信息的历史记录
本文重点介绍使用扩展事件来捕获等待信息,但不介绍扩展事件本身的使用,重点放在如何使用扩展事件来获取想要的等待事件信息。
需要对扩展事件有一定的了解。

等待信息的获取途径

在SQL Server中有一个系统视图sys.dm_os_wait_stats记录了自数据库服务启动以来累积产生的等待信息,
如下图,这个结果是实例级的,也就是记录的整个数据库服务器所有的等待事件的累积。
多数时候参考意义不是很大,比如某一天的网络延时很高,sys.dm_os_wait_stats中累计记录了大量的ASYNC_NETWORK_IO等待信息。
但是到了第二天或者什么时候,网络变好了,但是sys.dm_os_wait_stats中记录的ASYNC_NETWORK_IO等待信息是不变的
也就是说sys.dm_os_wait_stats无法反映实时等待情况。

当然要获取实时的等待信息也简单,记录两个时间点之间sys.dm_os_wait_stats中等待时间的差值,可以间接地反映出来某一段时间的数据的等待信息。
但是这个信息仍然比较粗略,依旧是实例级的,某些时候依旧是不足够作为参考的。

另外一个是通过sys.dm_exec_requests这个系统视图的wait_type,wait_time等获取活动Session的等待信息
如截图,但是这个是活动Session的信息,当Session完成之后,它的等待信息就看不到曾经都产生了那些等待,分别是多久。
也就说,你无法追溯历史上某一个Session或者某一个SQL(存储过程)执行过程中的都产生了什么类型的等待,等待了多长时间。

实话说,不管是sys.dm_os_wait_stats还是sys.dm_exec_requests,在正常情况下,获取到的等待信息实用价值都是不高或者是适用场景有限。

更多的时候我们是想要更细一级的等待,比如某一个Login、某一部分Session、甚至某些特定的SQL(存储过程)的执行过程中产生的等待信息。
举个实际例子,数据库又10个Login给10个不同的应用程序访问,其中只有1个应用程序端反馈说访问数据库慢,或者有性能问题,其他Login都反馈正常
那么很有可能是这个Login请求自己的问题,此时就需要针对这一个Login的情况进行针对性分析,而不是在实例级分析诊断。
如果能够拿到这个Login执行的Session的等待情况,或者这个Login某些特定的数据库对象的执行过程中的等待信息,对定位问题的针对性的就比较强了。

本文就以此为切入点,针对如何获取Session级别的等待信息展开说明和演示。

SQL Server 2016中获取Session级别的等待信息

在SQL Server 2016中,获取Session级别的等待信息是比较方便的,有直接的系统视图sys.dm_exec_session_wait_stats可以使用
当前情况下,想要知道某一个Session的等待信息就很简单了,
在sql语句开始的时候把当前Session的等待信息记录下来
在sql语句结束的时候把当前Session的等待信息再次记录出来
计算两次等待信息的差值,就可以知道当前Session运行的过程中有哪些等待,分别是多少。

  sqlserver开发团队可能也意识到了对于等待信息,更多的时候,需要的是较为具体的等待,而不是一个笼统的实例级的等待
  因此在SQL Server 2016中增加了sys.dm_exec_session_wait_stats这个支持统计Session级别的等待的视图
  很不幸的SQL Server2016之前的版本中是没有这个系统视图可以很方便地记录Session级别的等待。
  但是可以借助扩展事件来实现类似的功能。

使用扩展事件来捕获Session级别的等待信息

因为这里是是用扩展事件来实现的,这里要求读者要对扩展事件有一个基本的认识,扩展事件本身就不多说了。
上代码,启动一个扩展事件,来记录执行时间超过三秒的SQL语句,其执行过程中等待时间大于0的等待事件信息。
当然这个捕获的信息可以加上各种过滤条件。具体参考代码备注。

IF EXISTS(SELECT * FROM sys.server_event_sessions WHERE name=‘CollectionSessionWaitStats‘)
  DROP EVENT session CollectionSessionWaitStats ON SERVER;
GO

--  创建事件会话
CREATE EVENT SESSION CollectionSessionWaitStats ON SERVER
ADD EVENT sqlserver.rpc_completed
(
    ACTION
    (
        sqlos.task_time,
        sqlserver.database_name,
        sqlserver.nt_username,
        sqlserver.username,
        sqlserver.sql_text,
        sqlserver.session_id,
        sqlserver.transaction_id
    )  WHERE [duration]>=3000000
),
ADD EVENT sqlserver.sql_batch_completed
(
    ACTION
    (
        sqlos.task_time,
        sqlserver.database_name,
        sqlserver.nt_username,
        sqlserver.username,
        sqlserver.sql_text,
        sqlserver.session_id,
        sqlserver.transaction_id
    ) WHERE [duration]>=3000000
),
ADD EVENT sqlos.wait_info
(
    ACTION
    (
        sqlos.task_time,
        sqlserver.database_name,
        sqlserver.nt_username,
        sqlserver.sql_text,
        sqlserver.username,
        sqlserver.session_id,
        sqlserver.transaction_id
    ) WHERE  session_id>50
            and opcode=1
            and duration>0
            and sql_text not like ‘%sp_MScdc_capture_job%‘ --排除某些信息
            --and username = ‘‘ --限定只记录某些信息
),
ADD EVENT sqlos.wait_info_external
(
    ACTION
    (
        sqlos.task_time,
        sqlserver.database_name,
        sqlserver.nt_username,
        sqlserver.username,
        sqlserver.sql_text,
        sqlserver.session_id,
        sqlserver.transaction_id
    ) WHERE   session_id>50
            and opcode=1
            and duration>0
            and sql_text not like ‘%sp_MScdc_capture_job%‘
            --and username = ‘‘
)
ADD TARGET package0.event_file
(
    SET filename=N‘D:\XEventFiles\CollectionSessionWaitStats‘,
    max_file_size=(1024),
    max_rollover_files=(10)
)
WITH (
        MAX_MEMORY=4096 KB,
        EVENT_RETENTION_MODE=ALLOW_SINGLE_EVENT_LOSS,
        MAX_DISPATCH_LATENCY=30 SECONDS,
        MAX_EVENT_SIZE=0 KB,
        MEMORY_PARTITION_MODE=NONE,
        TRACK_CAUSALITY=OFF,
        STARTUP_STATE=ON
    )
GO

--  启用(停止)事件会话(START / STOP)
ALTER EVENT SESSION CollectionSessionWaitStats ON SERVER STATE=START
GO

是用扩展事件收集的Session级别的等待信息有以下几个特点
1,SessionId是可以重复的
  举例说明就是:比如一个SessionId = 80的Session,可以第一次执行一个SQLA,第二次执行一个SQLB.
  同时这两个SQL的执行与其执行过程中产生的等待信息都可以被捕获出来
2,同一个时间段内,一个同一个SessionId不可能同时执行,
  比如16:46:36秒到16:46:46秒到这个时间内,SessionId = 80的Session正在执行,扩展事件捕获到了其产生的等待信息
  但是在16:46:36秒到16:46:46这个时间段内,不可能有另外一个SessionId = 80也在执行,这个逻辑不难理解
为什么要特意说明这个问题?
因为扩展事件收集到的事件信息中SQL语句完成事件(rpc_completed或者sql_batch_completed)与产生的等待之间,没有一个直接的对应关系。

怎么理解?动起手来才能发现问题,我是这个纠结了大半天,截图示例。

如下截图,扩展事件捕获到的两个目标事件的SessionId都是58,但是执行的SQL是不一样的,

如下截图是不区分事件类型,捕获到的所有的事件信息。

也就是上面说的,对于58号Session:
第一次运行了SELECT COUNT(1) FROM TestCollectionSessionWaitStats
第二次运行了SELECT COUNT(1) FROM TestCollectionSessionWaitStats WHERE Id>10
两次运行的SQL一致或者不一致问题不大,关键是捕获到的等待事件信心的SessionId也是58,怎么区分产生的事件是归属于哪一次的运行?
比如58号Session运行两次sql,产生了10条等待信息,怎么区分这10条等待信息哪些归属于第一次运行生成的,哪些归属于第二次运行生成的?
这个就依靠上面说的第二点“同一个时间段内,一个同一个SessionId不可能同时执行”
对于同一个SessionId,在sql_batch_completed事件中,从时间的维度来看
小于第一次sql_batch_completed事件完成时间的必然是58号Session第一次执行生成的
大于第一次sql_batch_completed事件完成事件的且小于第二次sql_batch_completed的必然是58号Session第二次执行生成的
有了这个理论基础,我们统计Session级别的等待就比较容易了,相信这个逻辑的实现并不难。

如下图是58号Session执行某SQL语句产生的等待详细信息,可以看到多次产生了CXPACKET和 PAGEIOLATCH_SH等待
鉴于截图问题,下面还有另外一个同样是58号Session的执行另外一个SQL捕获到的等待信息
这个统计办法就是上面提到的,在两次sql_batch_completed事件中,虽然等待事件的SessionId一样,
但是其发生的时候是处于当前事件的sql_batch_completed之前,上一次sql_batch_completed之后,
这样就可以完美地匹配到sql_batch_completed事件与其对应的wait_info事件。
在这种情况下,统计得到类似于SQL Server 2016中的sys.dm_os_wait_stats的结果也就不难了。

  

与sys.dm_os_wait_stats 等待信息的结果相比,上述通过扩展事件获取的等待信息,是不是更加详细和具体?
比如对于CXPACKET等待时间,
不难发现,如果计算计算其产生的次数(count),就类似于sys.dm_os_wait_stats 中的waiting_tasks_count,计算其产生的总时间(sum),就类似于wait_time_ms
但是上述时间的信息已经细化到Session级别了,比sys.dm_os_wait_stats 中的等待信息更有参考价值。
对于问题的诊断和分析,也会是更加有效。

上述统计结果的SQL语句

-- Parse the XML to show rpc_completed,sql_batch_completed details
if object_id(‘tempdb..#t1‘) is not null
    drop table #t1
SELECT
    event_xml.value(‘(./action[@name="session_id"]/value)[1]‘, ‘INT‘) as session_id,
    event_xml.value(‘(./@timestamp)‘, ‘varchar(1000)‘) as timestamp,
    event_xml.value(‘(./data[@name="statement"]/value)[1]‘, ‘varchar(max)‘) as statement,
    event_xml.value(‘(./data[@name="batch_text"]/value)[1]‘, ‘varchar(max)‘) as batch_text,
    event_xml.value(‘(./@name)‘, ‘varchar(1000)‘) as Event_Name,
    event_xml.value(‘(./data[@name="duration"]/value)[1]‘, ‘bigint‘) as Duration,
    event_xml.value(‘(./data[@name="cpu_time"]/value)[1]‘, ‘bigint‘) as cpu_time,
    event_xml.value(‘(./data[@name="physical_reads"]/value)[1]‘, ‘bigint‘) as physical_reads,
    event_xml.value(‘(./data[@name="logical_reads"]/value)[1]‘, ‘bigint‘) as logical_reads,
    event_xml.value(‘(./action[@name="username"]/value)[1]‘, ‘varchar(max)‘) as username
INTO #t1
FROM (
        SELECT CAST(event_data AS XML) xml_event_data
        FROM sys.fn_xe_file_target_read_file(N‘D:\XEventFiles\CollectionSessionWaitStats*‘, NULL, NULL, NULL)

     ) AS event_table
CROSS APPLY xml_event_data.nodes(‘//event‘) n (event_xml)
WHERE event_xml.value(‘(./@name)‘, ‘varchar(1000)‘)  in (‘rpc_completed‘,‘sql_batch_completed‘)
order by Event_Name

-- Parse the XML to show wait_info,wait_info_external details
if object_id(‘tempdb..#t2‘) is not null
    drop table #t2
SELECT
    cast(event_xml.value(‘(./@timestamp)‘, ‘varchar(1000)‘) as DATETIME2) as timestamp,
    event_xml.value(‘(./data[@name="duration"]/value)[1]‘, ‘bigint‘) as duration,
    event_xml.value(‘(./action[@name="session_id"]/value)[1]‘, ‘INT‘) as session_id,
    event_xml.value(‘(./data[@name="wait_type"]/text)[1]‘, ‘VARCHAR(200)‘) as wait_type
INTO #t2
FROM (
        SELECT CAST(event_data AS XML) xml_event_data
        FROM sys.fn_xe_file_target_read_file(N‘D:\XEventFiles\CollectionSessionWaitStats*‘, NULL, NULL, NULL)
     ) AS event_table
     CROSS APPLY xml_event_data.nodes(‘//event‘) n (event_xml)
WHERE event_xml.value(‘(./@name)‘, ‘varchar(1000)‘)  in (‘wait_info‘,‘wait_info_external‘)

if object_id(‘tempdb..#t3‘) is not null
    drop table #t3

SELECT
    a.session_id                    AS SessionId,
    isnull(statement,batch_text)    AS SQLTEXT,
    a.Duration                        AS TotalExecuteTime,
    CAST(a.timestamp AS DATETIME2)    AS CompletedTime,
    CAST(b.timestamp AS DATETIME2)    AS WaitTypeStartTime,
    b.wait_type                        AS WaitType,
    b.duration                        AS WaitDuration
INTO #t3
FROM #t1 a INNER JOIN #t2 b on a.session_id = b.session_id
    and b.timestamp < a.timestamp
    and b.timestamp>(
                         select top 1 timestamp from #t1 c
                         where a.session_id = a.session_id and a.timestamp > b.timestamp
                         order by a.timestamp
                    )

select
    case when rn = 1 then SessionId else NULL end as SessionId,
    case when rn = 1 then SQLTEXT else NULL end as SQLTEXT,
    case when rn = 1 then TotalExecuteTime else NULL end as TotalExecuteTime,
    CompletedTime as CompletedTime,
    WaitType,
    WaitTypeStartTime as WaitTypeStartTime,
    WaitDuration
from
(
    select ROW_NUMBER()over(partition by SessionId,SQLTEXT,TotalExecuteTime,CompletedTime order by CompletedTime,WaitTypeStartTime) as rn,
    * FROM #t3
)t 

当然该语句仅供参考,目的是为了收集Session级的统计信息,当收集到Session级别的统计信息之后,具体的统计方式也不难。

  

总结
   等待事件可以帮助我们诊断SQL Server上的一些资源瓶颈,对于问题的处理和解决有着比较重要的参考意义,如果能够细化地收集等待事件,对于解决问题的参考意义会更大。
   本文通过一个简单的示例,使用扩展事件来收集SQL Server中一些特定场景下的等待信息,来更加有针对性地进行问题的诊断和识别,使得问题的分析更加高效和具有针对性。

  

时间: 2024-08-03 10:16:25

SQLServer中使用扩展事件获取Session级别的等待信息以及SQLServer 2016中Session级别等待信息的增强的相关文章

如果正确读取SQL Server中的扩展事件?

SQL Server中使用扩展事件捕捉所需的信息后,可以选择存放的位置.比如说内存或文件中,但无论存在哪里,其本质都是一个大XML.因此在SQL Server中读取该XML就是解析扩展事件结果的方式. 微软官方或者一些SQL Server论坛提供了使用SQL XML解析扩展事件的脚本,如代码清单1所示. 1: WITH events_cte 2: AS ( SELECT DATEADD(mi, 3: DATEDIFF(mi, GETUTCDATE(), CURRENT_TIMESTAMP), 4

BaseTool中鼠标双击事件获取鼠标位置的方法

ArcGISEngine的BaseTool类中提供了鼠标双击.鼠标移动.鼠标按键按下.鼠标按键弹起四种鼠标事件,但是鼠标双击事件的参数跟其他三种不一样,双击事件中没有提供鼠标位置信息. public virtual void OnDblClick(); public virtual void OnMouseDown(int Button, int Shift, int X, int Y); public virtual void OnMouseMove(int Button, int Shift

SQL 扩展事件

在本篇,我通过使用新建“Session ”对话框来创建新的扩展事件会话.定义一个自己的扩展事件,动作和谓词,并且发布一个以收集事件数据为目的的会话. 首先从UI开始 在SQLServer2008R2以后(不包括2008R2),才引入扩展事件的内置UI.2008的版本可以通过安装插件的形式或者使用T-sql语句来实现扩展事件.如果是2012以后的SSMS客户端,也可以访问2008 的数据库实例,但是看不到扩展事件UI.在2008版本中缺少UI,意味着必须写T-SQL和XQuery来挖掘事件数据.2

SQL Server扩展事件(Extended Events)-- 使用system_health默认跟踪会话监控死锁

SQL Server扩展事件(Extended Events)-- 使用system_health默认跟踪会话监控死锁 自SQL Server 2008以后,提供了扩展事件(Extended Events)来跟踪系统分析定位问题.默认的system_health会话一直在运行,可以帮助你更快的定位问题. 运行如下脚本可以看到system_health扩展事件会话: SELECT * FROM sys.dm_xe_sessions 即便是你没有启动任何扩展事件会话,这个查询也会返回一行system

SQL Server扩展事件-- 使用system_health默认跟踪会话监控死锁

SQL Server扩展事件(Extended Events)-- 使用system_health默认跟踪会话监控死锁 转自:http://blog.51cto.com/ultrasql/1600372 自SQL Server 2008以后,提供了扩展事件(Extended Events)来跟踪系统分析定位问题.默认的system_health会话一直在运行,可以帮助你更快的定位问题. 运行如下脚本可以看到system_health扩展事件会话: SELECT * FROM sys.dm_xe_

SQL Server 扩展事件

SQL Server 扩展事件(Extended Event)是用于服务器的常规事件处理系统,是追踪SQL Server系统运行状态的神器,同时也是一个日志记录工具,扩展事件完全可以取代SQL追踪(SQL Trace),扩展事件的设计功能: 由于扩展事件引擎不识别事件,因此,引擎可以将任何事件绑定到任何目标,因为引擎不受事件内容约束. 事件与事件使用者不同,后者在扩展事件中称为“目标”(Target),也就是说任何目标可以接收任何事件.此外,引发的任何事件均可供目标自动使用,这样可以记录或提供额

SQL Server扩展事件(Extended Events)-- 性能注意事项

SQL Server扩展事件(Extended Events)-- 性能注意事项 使用 CREATE EVENT SESSION 将扩展事件会话放置在一起时,需要认真正确配置一些设置,因为它们可能会在无意中对性能产生影响.首先需要决定是以同步还是异步方式消耗事件.正如您所料,同步目标对所监控代码的性能产生的影响要大过异步目标. 如前所述,同步消耗某个事件时,触发该事件的代码必须一直等待,直到该事件被消耗为止.显然,如果事件消耗是一个复杂的过程,则这可能会降低代码的性能. 例如,在一个每秒处理数千

SQL Server扩展事件(Extended Events)&mdash;使用system_health扩展事件会话

SQL Server扩展事件(Extended Events)-使用system_health扩展事件会话 system_health 会话是 SQL Server 默认包含的扩展事件会话. 该会话在 SQL Server 数据库引擎启动时自动启动,并且运行时不会对性能造成任何明显影响. 该会话收集的系统数据可用于帮助对数据库引擎的性能问题进行故障排除. 因此,我们建议您不要停止或删除该会话. 此会话源自产品支持团队的想法,它可以跟踪通常被用来对客户系统进行调试的信息(例如当客户系统发生死锁或出

用表来管理SQLServer中的扩展属性(描述)

数据字典是个好东东,对于开发.维护非常重要. 但Sql Server中写描述确实不方便,如何化繁为简.批量地增加修改扩展属性呢? 增加2个表和5个存储过程.2个触发器.1个表值函数就好了. 把下面的SQL执行一遍生成相关的对象, 然后执行一下: 1. EXEC Proc_Util_Desc_GetColumnNameToDescTable , 生成表的描述对应记录 2. EXEC Proc_Util_Desc_GetTableNameToDescTable, 生成列的描述对应记录 3. 查看,