Zabbix3.2告警升级机制

 Zabbix监控项目的增多,警告报警也会越来越多,如果监控项长时间处于一个反复报警的状态时,可能是没有人去解决 也可能是他们无法去解决的时候,再去向上级发送告警 那么zabbix就可以通过它的告警机制去实现 它可以通过自定义时间段,发送消息、命令 从而形成分级的报警机制。

默认单步骤操作持续时间 最低是60秒
以上告警有两个等级:设置的1800,间隔为30小时
一线人员:第1、3 步发送告警给devops用户 间隔时间是30分钟,发送3次 直到故障恢复
二线人员 :1小时30分钟后,第4、5、6步发送钉钉机器消息devops用户,间隔时间是30分钟,发送3次 直到故障恢复

devops用户每隔30分钟发送一次报警直到故障恢复, 用户devops在故障后的1小时30分钟后,每隔5分钟发送一次告警 共计发送3次
时间: 2024-11-06 07:17:20

Zabbix3.2告警升级机制的相关文章

Zabbix告警升级机制图文详解

Zabbix告警升级机制图文详解 配置目的 随着监控项目的增多,有一些警告性质的报警可能不许要让领导收到,如果监控项长时间处于一个反复报警的状态时,可能是没有人去解决 也可能是他们无法去解决的时候,再去向上级发送告警 那么zabbix就可以通过它的告警机制去实现 它可以通过自定义时间段,发送消息.命令 从而形成一个梯度的报警机制.通过下图解释梯度报警的设置方法. 简单的配置第个,剩下的配置类似,重点不在于如何配置这个,重点在于如何配置"告警升级"和发送时间的理解 配置图解 步骤持续时间

zabbix3.0.0升级zabbix3.2.1版本

背景: 近期公司的zabbix经常有已出的告警无法消除,必须重启后才能消除告警的Bug.后来了解到这是zabbix3.0.0版本的一个bug,所以考虑把在用的zbbix版本升级至最新版本3.2.1. zabbix3.0.0版本与zabbix3.2.1版本的升级很简单,但是有许多小问题.比如两个版本的数据库表不一致的问题,所以一定要做好备份的操作. zabbix服务器相关目录: 备份目录:     /opt/backups/zabbix zabbix主目录:  /opt/apps/zabbix 服

node-webkit中数据库升级机制

写了个模块,本模块中应用了sqllite3数据库,升级原理是检查数据库的version版本表中版本值,把版本值加一之后去读取对应的sql文件,执行sql语句,然后依次循环说取下一个文件直到完成. 本模块中所有sql文件放在/sql/文件夹下,如:contact_create.sql,contact_update_1.sql,contact_update_2.sql,等等,使用时执行 updateUserDB()方法就行. var _=require("underscore"); var

zabbix3.x.x升级教程

1:停掉正在运行的zabbix服务,确保没有新数据写入数据库. /etc/init.d/zabbix_server stop 2:备份原zabbix的数据库数据,以及相关文件. mysqldump -h 127.0.0.1 -u zabbix -ppassword zabbix > /opt/backup/zabbix/zabbix_bak.sql mv /usr/local/service/zabbix /usr/local/service/zabbix3.2.7 mv /usr/local/

zabbix告警升级的迷惑

zabbix进阶告警设置失败,主要表现如下: 主要是宕机host已经加入维护(Maintenance),但是进阶告警还会一直发送.

成为运维界的「福尔摩斯」,你还需要3个帮手!

夏洛克·福尔摩斯,一直以来柯南道尔笔下的福尔摩斯形象在人们的脑海中都栩栩如生.敏锐的观察力,缜密的推理思路,丰富的专业知识,一切扑朔迷离的刑事案件在他手中都能迎刃而解,一切的竞争对手在他面前都如此的黯然失色.他有一双能够看穿世界的眼睛,被他关注的人都好像身体上被安装了监控,所有的行动他都了如指掌.在福尔摩斯的领域中,任何的异动都掌握在他的手中,并且这些异动信息会第一时间到达他的手中.福尔摩斯教会了我们,善于使用工具,能够让工作事半功倍. <血字的研究>一案中,一把直尺,一个放大镜等等都成为了破

Zabbix之action配置

Zabbix的action有三个配置项Action Conditions Operations,动作类型有两种.一发送消息,二执行远程命令 Action的配置 最主要的就是配置内容.定义宏 参数 描述 Name 唯一的action名称 Default subject 默认的消息主题,可以包含宏{TRIGGER.STATUS} Default message 默认的消息内容可以包含宏(macros) Recovery message 事件恢复的消息,即事件从problem到ok状态,仅会发送一次消

一篇文章全面了解监控知识体系

前言介绍 监控是整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的数据用于追查定位问题. 目前业界有很多不错的开源产品可供选择.选择一款开源的监控系统,是一个省时省力,效率最高的方案.当然对监控不是很明白的朋友们,看了以下文章可能会对监控整个体系有比较深刻的认识. ps:本文内容较多,文章篇幅很长,可以先收藏,后续慢慢阅读. 0 监控目标 我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同.公司不同.业务不同.岗位不同.对监控的理解也不同,

分分钟拯救监控知识体系

0 监控目标 我们先来了解什么是监控,监控的重要性以及监控的目标,当然每个人所在的行业不同.公司不同.业务不同.岗位不同.对监控的理解也不同,但是我们需要注意,监控是需要站在公司的业务角度去考虑,而不是针对某个监控技术的使用. 监控目标 1.对系统不间断实时监控:实际上是对系统不间断的实时监控(这就是监控) 2.实时反馈系统当前状态:我们监控某个硬件.或者某个系统,都是需要能实时看到当前系统的状态,是正常.异常.或者故障 3.保证服务可靠性安全性:我们监控的目的就是要保证系统.服务.业务正常运行