AG排查和监控指南
1. 排查场景
如下表包含了常用排查的场景。根据被分为几个场景类型,比如Configuration,client connectivity,failover和performance。
2. 排查工具
以下工具可以用来排查,配置时或者运行时发生的问题
Tool |
笔记 |
Description |
Use the AlwaysOn Dashboard (SQL Server Management Studio) |
在UI接口下,获取某个时间点的AG健康情况。 |
|
AlwaysOn Policies |
被Alwayson Dashboard使用 |
|
SQL Server Error Log (AlwaysOn Availability Groups) |
SQL Server错误日志(AG) |
记录AG,副本,数据库,其他AG主键的状态变化,和AG的错误 |
CLUSTER.LOG (AlwaysOn Availability Groups) |
CLUSTER.LOG(AG) |
记录集群时间,包括AG资源的状态变化,SQL Server resource DDL的事件和错误。 |
AlwaysOn Health Diagnostics Log |
AlwaysOn健康诊断日志 |
记录SQL Server健康诊断被报告到WSFC集群,由sp_server_diagnostics (Transact-SQL)产生 |
Dynamic Management Views and System Catalog Views (AlwaysOn Availability Groups) |
DMV和系统目录视图 |
报告AG的信息,比如配置,健康状况,性能问题 |
AlwaysOn Extended Events |
AG扩展事件 |
提供了详细AG信息用来诊断,分析起因 |
AlwaysOn Wait Types |
AlwaysOn等待类型 |
提供了AG特定的等待信息,用来调整性能 |
AlwaysOn Performance Counters |
监控AG的活动,反馈到系统监视器,用来调优,具体可以看 SQL Server, Availability Replica 和 SQL Server, Database Replica. |
|
AlwaysOn Ring Buffers |
AlwaysOn Ring Buffers |
记录SQL Server系统内部争端的警告,用来debug和AG有关的问题。 |
3. 监控AG
理想的排查时间是在故障转移之前。这个可以通过监控性能值,在超过SLA之前发送告警。比如同步secnodary副本有性能问题,因为预计failover时间增加。AG是高可用和灾难恢复解决访问,最重要的性能指标是切换时间,会影响RTO,灾难导致的数据丢失会影响RPO。
以下表文章用来监控AG的健康状况:
Topic |
笔记 |
Description |
Monitor Performance for AlwaysOn Availability Groups |
监控AG性能 |
描述AG数据同步,阀值控制,和一些有用的值用来监控AG,还有如何收集RTO,RPO的值。 |
Monitoring of Availability Groups (SQL Server) |
提供一些AG监控工具 |
|
The AlwaysOn Health Model Part 1 -- Health Model Architecture |
健康模型 Part 1——概述 |
提供一个Alwayson健康模型的概述 |
The AlwaysOn Health Model Part 2 -- Extending the Health Model |
健康模型 Part 2 ——扩展 |
如何用户定制Alwayson监控模型和用户定义Alwayson Dashboard,来显示额外的信息。 |
Monitoring AlwaysOn Health with PowerShell - Part 1: Basic Cmdlet Overview |
使用Powershell监控AlwayOn健康 |
提供一些基本的Alwayson Powershell命令。用来监控AG的健康状况。 |
Monitoring AlwaysOn Health with PowerShell - Part 2: Advanced Cmdlet Usage |
使用Powershell监控AlwayOn健康 |
提供一些高级的Alwayson Powershell命令。用来监控AG的健康状况。 |
Monitoring AlwaysOn Health with PowerShell - Part 3 : A Simple Monitoring Application |
使用Powershell监控AlwayOn健康 |
显示如何使用城区监控AG。 |
Monitoring AlwaysOn Health with PowerShell - Part 4 : Integration with SQL Server Agent |
使用Powershell监控AlwayOn健康 |
如何使用SQL Server Agent集成监控AG,并且在出问题的时候通知。 |
时间: 2024-10-14 23:16:27