sql server监控清单

数据库服务器的监控可大致分为两类:

(1) 状态监控:数据库服务器有没有在健康地运行?

(2) 性能监控:健康运行的同时,有没有性能问题?可不可以更快些?

服务器

1. 状态监控

(1) 服务器是否可访问?

(2) 数据库服务是否启用?

(3) 操作系统事件日志中的错误或告警

(4) 磁盘可用空间

2. 性能监控

(1) IO压力

(2) 内存使用

(3) CPU使用

(4) 网络带宽占用

这1,2,3,4是按照容易出现瓶颈的顺序排列的,由于磁盘的读写速度限制,通常IO是最容易出现瓶颈的地方,我们所做的很多优化,也都是针对IO的,比如:索引优化,读写分离等等。

数据库

1. 状态监控

(1) 数据库可否打开 (数据库状态)

(2) SQL Server/SQL Server Agent错误日志中的错误或告警

(3) 数据库/文件组可用空间

(4) SQL Agent 作业运行状态

(5) 数据库备份有没有成功

(6) 数据库还原测试的结果

(7) 数据库一致性检查的结果 (DBCC CHECKDB)

以下几条状态监控,通常需要和系统平均值/基线值比较才有意义,否则没有告警的标准。

(8) 连接数、请求数、事务数、线程数

(9) 数据库/文件/表的大小

(10) 表使用、行数

2. 性能监控

(1) 有没有长时间运行的查询 (一般指没有被任何请求阻塞,效率很差的查询)

(2) 有没有被阻塞的查询 (可能单独运行很快,但和别的请求一起,由于有锁等待,耗时很长)

(3) 有没有死锁 (开发人员/用户口中说的”死锁” 通常是阻塞/等待,数据库死锁通常很少让用户感觉到等待,一般是请求被中断,因为被kill掉了)

(4) 有没有等待 (一般指各种资源的等待,等待和阻塞的交集就是锁等待)

以下几条性能监控,通常在性能优化时作为参考,或者如:索引碎片整理/统计信息更新,直接设置为后台维护作业,并不直接告警。

(5) 有没有缺失的/未被使用的/效率不高的索引,以及索引碎片

(6) 有没有过期的统计信息

(7) 有没有数据库文件的争用 (比如:日志文件,tempdb争用)

(8) 有没有消耗CPU较大、IO读写较多的查询 (通常IO消耗大的,也就是内存消耗大的查询)

其他

(1). 如果有部署高可用的策略,会有镜像、复制、日志传送、集群状态的监控;

(2). 某些业务数据有严格的一致性要求,业务数据的校验,最好也做在监控的告警里面;

(3). 对于数据库/实例的选项、参数设置,链接服务器等对象的可用性,通常在每年/每季度的health check里检查过就可以了,如果不放心,当然也可以放到监控的告警中来。

如何部署监控?

1. 不要选择依赖性的脚本/命令

以监视服务是否启动为例,脚本如下:

(1) SQL扩展存储过程


1

2

3

4

5

6

7

8

9

--参数1: QueryState 检查服务状态/ Start启动服务/ Stop停掉服务

--参数2: 服务名

exec master.dbo.xp_servicecontrol‘QueryState‘‘MSSQLServer‘

exec master.dbo.xp_servicecontrol‘QueryState‘‘SQLServerAgent‘

exec master.dbo.xp_servicecontrol‘QueryState‘‘SQLBrowser‘

exec master.dbo.xp_servicecontrol‘QueryState‘‘NetLogon‘

 

EXEC xp_servicecontrolN‘Stop‘, N‘SQLServerAGENT‘

EXEC xp_servicecontrolN‘Start‘,N‘SQLServerAGENT‘

 

(2) SQL调用操作系统命令


1

2

3

4

5

6

7

8

9

10

if OBJECT_ID(‘tempdb..#tmp_started_services‘is not null

    drop table #tmp_started_services

create table#tmp_started_services(started_servicesvarchar(255))

 

insert into#tmp_started_services(started_services)   

exec master..xp_cmdshell‘net start‘

 

select 

  from#tmp_started_services 

 where LTRIM(RTRIM(started_services)) like ‘SQL%‘

如果SQL Server没启动,这些脚本根本就跑不了,又怎么监控呢?

也许,又会有这么一个思路,服务器正常时,发出邮件通知,如果没有收到邮件就说明服务器不正常了,可如果有很多服务器时,怎么知道谁没发邮件呢?

2. 部署在专门的一台/多台监控机上

服务器状态监控,不管使用第三方工具,还是使用自定义脚本,都建议部署在专门的监控机上,远程监视目标机器。

因为:如果服务器DOWN了或者故障了,可能本机的程序/脚本就无法运行了,又怎么监控呢?

最后

基于上面的监控列表,还需要将监测工作自动化,并在发现问题时告警。

转自:http://blog.51cto.com/qianzhang/1256127

原文地址:https://www.cnblogs.com/gered/p/9369194.html

时间: 2024-10-22 15:01:58

sql server监控清单的相关文章

0. SQL Server监控清单

原文:0. SQL Server监控清单 数据库服务器的监控可大致分为两类: (1) 状态监控:数据库服务器有没有在健康地运行? (2) 性能监控:健康运行的同时,有没有性能问题?可不可以更快些? 一. 服务器 1. 状态监控 (1) 服务器是否可访问? (2) 数据库服务是否启用? (3) 操作系统事件日志中的错误或告警 (4) 磁盘可用空间 2. 性能监控 (1) IO压力 (2) 内存使用 (3) CPU使用 (4) 网络带宽占用 这1,2,3,4是按照容易出现瓶颈的顺序排列的,由于磁盘的

SQL Server 监控统计阻塞脚本信息

原文:SQL Server 监控统计阻塞脚本信息 数据库产生阻塞(Blocking)的本质原因 :SQL语句连续持有锁的时间过长 ,数目过多, 粒度过大.阻塞是事务隔离带来的副作用,它是不可避免的,而且是一个数据库系统常见的现象. 但是阻塞的时间和出现频率要控制在一定的范围内,阻塞持续的时间过长或阻塞出现过多(过于频繁),就会对数据库性能产生严重的影响. 很多时候,DBA需要知道数据库在出现性能问题时,有没有发生阻塞? 什么时候开始的?发生在那个数据库上? 阻塞发生在那些SQL语句之间? 阻塞的

SQL Server监控全解析

SQL Server监控全解析 在SQL Server的日常管理中,让SQL Server高效运行,且性能良好,是DBA需要做的事.DBA需要了解数据库的日常运行情况,对性能进行分析和调优,需要对线上环境部署监控.那我们都需要监控哪些方面呢? SQL Server服务器的CPU.内存.IO.网络流量.缓存等资源性能怎么样,各个相关服务如SQL Server服务.SQL Server代理服务等是否正常运行,这些一般使用开源的监控软件Zabbix来设置告警,当然针对数据库服务器的特性,添加一些SQL

高级DBA之路——《SQL Server 监控和诊断》

编写各大终端的程序员常常有"SQL语言很简单,DBA工作很轻松"的错觉,用惯了SQLite及其扩展框架OrmLite和GreenDAO的Android程序员更是如此,尤其当一个Android程序员看见自己上大学时又挂科又留级的损友从事DBA工作之后:"不好好学习也就只能用SQL增删改查了". 然而和各大终端编写SQL代码仅为了给界面做缓存不同,在服务器端的SQL Server的日常管理中,DBA需要考虑的是如何让SQL Server高效运行,且性能良好:DBA不仅需

SQL Server 监控 使用sp_trace_create

监控前言 上一节我们提到了MSSQL的基于SQL Event的监控,但是有些时候我们需要更加详细.适用于调优排错的监控.SQL Server内部运行的可见性是的查询调整.优化和综合排查成为可能!这一节主要和大家说说SQL Server跟踪(SQL Server Profile)的一些监控方式和途径. 使用场景     记得某次给一家公司调优的时候,负责人发给我一堆业务的T-SQL脚本,我面对海量脚本还是从容,虽然不了解内部复杂的业务,但是我们得专注问题的关键 "慢",我们根据查询的&q

SQL Server监控报警架构_如何添加报警

一.数据库邮件报警介绍 数据库邮件是从SQL Server数据库引擎发送电子邮件企业解决方案,使用简单传输协议(SMTP)发送邮件.发送邮件进程与数据库的进程隔离,因此可不用担心影响数据库服务器. 数据库邮件发送要求联网,考虑数据库服务器的安全性,不能将所有服务器的外网开启:处理如下图所示:1.监控服务器轮询每个SQL数据库服务器:2.将获取的数据在监控服务器上集中处理,3.然后通过监控服务器的邮件服务发送邮件. 二.邮件模块处理 笔者发送的邮件内容如下所示,可分为个部分:1.发送主体(发生者)

一图胜千言 -- SQL Server 监控

原文地址:http://blog.51cto.com/ultrasql/2130477

sql server数据库状态监控

sql server数据库监控 转自:https://www.cnblogs.com/seusoftware/category/500793.html 6. SQL Server数据库监控 - 如何告警 5. SQL Server数据库性能监控 - 当前请求 4. SQL Server数据库状态监控 - 作业状态 3. SQL Server数据库状态监控 - 可用空间 2. SQL Server数据库状态监控 - 错误日志 1. SQL Server服务器监控实现方法 0. SQL Server

SQL Server中的事务日志管理(9/9):监控事务日志

当一切正常时,没有必要特别留意什么是事务日志,它是如何工作的.你只要确保每个数据库都有正确的备份.当出现问题时,事务日志的理解对于采取修正操作是重要的,尤其在需要紧急恢复数据库到指定点时.这系列文章会告诉你每个DBA应该知道的具体细节. 对于在我们关注下的所有数据库,在日志维护方面,我们的首要目标是最优化写性能,为了支持SQL Server写入日志的所有活动,包括数据修改,数据读取,索引维护等等.但是,留意下可能的日志碎片也是重要的,如前面文章介绍的,它会影响需要读取日志的过程性能,例如日志备份