Zabbix告警升级机制图文详解
配置目的
随着监控项目的增多,有一些警告性质的报警可能不许要让领导收到,如果监控项长时间处于一个反复报警的状态时,可能是没有人去解决 也可能是他们无法去解决的时候,再去向上级发送告警 那么zabbix就可以通过它的告警机制去实现 它可以通过自定义时间段,发送消息、命令 从而形成一个梯度的报警机制。通过下图解释梯度报警的设置方法.
简单的配置第个,剩下的配置类似,重点不在于如何配置这个,重点在于如何配置“告警升级”和发送时间的理解
配置图解
步骤持续时间如果不填就是用上面的默认操作步骤持续时间
1)第一种配置
1)开始于:这个是相对于
触发监控
的时刻到发送消息
的时间间隔
2)持续时间是每次发送消息
的时间间隔
3)1-3步是给运维人员
每隔5分钟
发一次报警信息,一共发3次就不发了(1一次,2一次,3一次)
4)4-5步是给运维总监
每隔1小时
发一次报警信息,一共发两次(4一次,5一次)
5)6步是给运维董事长
发一次报警信息,只发6一次
6)每次的开始时间是如何计算的呢?
a, 第一个立即开始没什么好说的
b, 第二个是1-2,2-3,3-4
到第四个动作才给运维总监发消息,因为1-3动作的时间间隔是5s
所以第四次应该是在触发告警
15分钟后才开始发送信息5m+5m+5m=15m
c, 第三个是1-2,2-3,3-4,4-5,5-6
到第6个动作的时候才发送消息,所以时间间隔 是5m+5m+5m+1h+1h=2h 15m
2)第二种配置
1)其实和第一种配置差不多,主要在于发给运维总监的动作
2)3-0代表在第3次动作之后一直
给运维总监按照设定的持续时间
间隔发送告警信息,直至警报解除
3)细心的你肯定发现我们同时配置了2次3动作,Zabbix是允许我们这样配置的,等到触发第三个动作的时候同时给"运维人员","运维经理"发送告警信息
4)所以这个时候发给运维总监的开始时间间隔是10m
,因为(1-2,2-3)等到第三次的时候就发送告警信息了(时间:5m+5m=10m)
3)第三种配置
1)只要触发告警就给运维人员每隔5分钟就发送一次告警信息,直至警报解除
2)发送给运维总监的就不介绍了
3)可以看出发送给运维董事长的告警信息开始的时间和我们上面描述的不一样了,因为这个时候发送给运维人员的告警信息还在持续,所以时间间隔是按照持续发送的那个时间来计算。,再次测试可以认证猜想
原文地址:http://blog.51cto.com/13447608/2298478