ZABBIX 监控基本报警故障

CPU触发器:
  1)Processor load is too high on {HOST.NAME} {HOST.NAME}上处理器负载太高
    触发器表达式:{Zabbix server:system.cpu.load[percpu,avg1].avg(5m)}>5
      告警等级:警告
  2)Disk I/O is overloaded on {HOST.NAME} 磁盘I/O在{HOST.NAME}上重载
    触发器表达式:{Zabbix server:system.cpu.util[,iowait].avg(1h)}>30
      告警等级:警告
  3){HOST.NAME} [CPU Idle]-[< 10%] CPU空闲小于百分之10
    触发器表达式:{Zabbix server:system.cpu.util[,idle].count(#5,10,"lt")}=5
      告警等级:一般严重

General触发器:
  1)Hostname was changed on {HOST.NAME} 主机名被更改
    触发器表达式:{Zabbix server:system.hostname.diff(0)}>0
      告警等级:信息
  2)Host information was changed on {HOST.NAME} 主机信息给更改
    触发器表达式:{Zabbix server:system.uname.diff(0)}>0
      告警等级:信息
  3)HOST.NAME} has just been restarted 重新启动主机
    触发器表达式:{Zabbix server:system.uptime.change(0)}<0
      告警等级:信息

Keepalived触发器
  1){HOST.NAME}keepalived进程宕机,请运维人员确认
    触发器表达式:({TRIGGER.VALUE}=0
and {Zabbix server:proc.num[keepalived,,,keepalived].change(0)}<0
and {Zabbix server:proc.num[keepalived,,,keepalived].last(0)}=0) or
({TRIGGER.VALUE}=1 and {Zabbix
server:proc.num[keepalived,,,keepalived].last(0)}<>3)
    告警等级:严重

Memory触发器
  1)Lack of free swap space on {HOST.NAME} 主机上缺少自由交换空间
    触发器表达式:{Zabbix server:system.swap.size[,pfree].last(0)}<10
      告警等级:警告
  2)Lack of available memory on server {HOST.NAME} 主机服务器上缺少可用的内存
    触发器表达式:{Zabbix server:vm.memory.size[available].last(0)}<20M
      告警等级:一般严重

Security触发器
  1)/etc/passwd has been changed on {HOST.NAME} 主机密码文件被更改
    触发器表达式:{Zabbix server:vfs.file.cksum[/etc/passwd].diff(0)}>0
      告警等级:警告

Processes触发器
  1)Too many processes running on {HOST.NAME} 在主机上运行的进程太多
    触发器表达式:{Zabbix server:proc.num[,,run].avg(5m)}>30
      告警等级:警告
  2)Too many processes on {HOST.NAME} 在主机上进程太多
    触发器表达式:{Zabbix server:proc.num[].avg(5m)}>1000
      告警等级:警告

Performace触发器
  1)Processor load is too high on {HOST.NAME} 在主机上处理器负载过高(1分钟)
    触发器表达式:{Zabbix server:system.cpu.load[percpu,avg1].avg(5m)}>5
      告警等级:警告

OS触发器
  1)Configured max number of processes is too low on {HOST.NAME} 主机上配置的最大进程数太低
    触发器表达式:{Zabbix server:kernel.maxproc.last(0)}<256
      告警等级:信息
  2)Configured max number of opened files is too low on {HOST.NAME} 在主机上配置的最大打开文件数太低
    触发器表达式:{Zabbix server:kernel.maxfiles.last(0)}<1024
      告警等级:信息

原文地址:https://www.cnblogs.com/kingle-study/p/10172413.html

时间: 2024-08-09 14:16:37

ZABBIX 监控基本报警故障的相关文章

zabbix监控大批量报警zabbix agent on **** unreachable for 5 minute

在9月4号和9月9号,公司的监控平台zabbix发生过俩次大规模的zabbix监控报警,都是zabbix agent on **** unreachable for 5 minute不可达,每次都是所有监控的主机发生这种报警. 故障描述:所有被监控的主机报警,所有图形数据都出现中断 操作:第一时间是在zabbix server 端执行zabbix_get 命令,发现可以得到数据,并且在命令面前添加time命令.显示出来得到的数据时间也是一个比较短的范围内的. 结果:过了10来分钟之后所有的报警就

zabbix监控mysql+报警

zabbix监控mysql性能 在Zabbix的监控系统中通常是由Zabbix Server与Zabbix Agent一起配合实现监控,在Zabbix Agent内置了很多监控基础的监控项. 这些监控项都是CPU, 文件系统, 网络,磁盘等基础的监控项,对于自己开发服务的监控,Zabbix提供了良好框架为用户实现监控和报警,下面将以为MySQL添加监控为例,介绍如何添加自定义监控. 实验环境 1.NySQL 192.168.2.6 (agent) 2.Zabbix Server 172.30.1

zabbix监控mysql报警

zabbix监控mysql性能 在Zabbix的监控系统中通常是由Zabbix Server与Zabbix Agent一起配合实现监控,在Zabbix Agent内置了很多监控基础的监控项. 这些监控项都是CPU, 文件系统, 网络,磁盘等基础的监控项,对于自己开发服务的监控,Zabbix提供了良好框架为用户实现监控和报警,下面将以为MySQL添加监控为例,介绍如何添加自定义监控. 实验环境 1.NySQL 192.168.2.6 (agent) 2.Zabbix Server 172.30.1

Zabbix 监控之 - 报警篇 Actions

通常,一个报警的产生,是这样的一个过程. 如果某种条件符合,那么报警. 抽象成计算机语言,就是: if (ConditionA == true){ Alet(); } 还可以选择给谁报警(哪个用户).怎样报警(报警途径),具体如下: if (ConditionA == true){ Alert(userA.email); Alert(userB.sms); } 如果处理问题不一定要报警,可以在服务器对于一些简单问题上运行一些命令的初步处理,比如Nginx挂了,自己就可以尝试的重启服务,则这又成了

zabbix监控平台部署详细文档

监控系统介绍 一:监控介绍 1.监控软件介绍:使用 SNMP 协议获取主机 CPU.内存.磁盘.网卡流量等数据.用脚本将获取到的 SNMP 数据存入数据库中,然后再使用一种名为 MRTG 的软件根据获取的数据绘制图表来分析数据的变化.MRTG(Multi Router Traffic Grapher),顾名思义,这款软件最初是设计用于监控网络链路流量负载的.它可以用过 SNMP 获取到设备的流量信息,并根据这些信息绘制成图表并保存为 PNG 格式的图片,再将这些 PNG 图片以HTML 页面的方

如何配置服务器自动监控并报警

作者:一个懂技术的运营 链接:https://www.zhihu.com/question/21073555/answer/106131463 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 如果是初创型公司,机器规模和工作流转没有那么复杂的情况下.运维监控和报警,都利用 Zabbix 和一些报警聚合服务. 先来说说,我们公司如何利用 Zabbix 监控和报警的吧. Zabbix 配置报警 其实线上的教程很多:Zabbix 的图文安装教程 . 下面自己 Zabb

Zabbix监控 之sendEmail脚本邮件报警配置【5】

本次zabbix邮件报警时通过sendEmail这一个轻量级的命令行的smtp电子邮件客户端,使用脚本的方式实现邮件报警. 此次使用的Linux发行版是CentOS 6.5,zabbix版本为3.0.3 Zabbix监控之不发送邮件异常[附属] 一.下载sendEmail wget http://caspian.dotconf.net/menu/Software/SendEmail/sendEmail-v1.56.tar.gz sendEmail安装方法: 1 2 3 shell# tar xv

zabbix 3.0监控邮件报警

zabbix 3.0 监控邮件报警 1.在监控服务器的/usr/local/zabbix/bin创建发送邮件脚本  vim send.py #!/usr/bin/env python  # -*- coding: utf-8 -*-  #!/usr/bmport pdb  import smtplib import string import time import sys reload(sys) sys.setdefaultencoding('utf-8') #pdb.set_trace() 

Zabbix分布式监控微信报警实战

作为运维工程师,最重要的事情就是保证该网站正常稳定的运行,需要实时监控网站.服务器的运行状态,并且有故障及时去处理. 监控网站无需人工时刻去访问WEB网站或者登陆服务器去检查, 可以借助开源监控软件例如Zabbix.Cacti.Nagios.Ganglia等监控来实现对网站的7x24小时的监控,并且可以做到有故障及时报警通知SA解决. Zabbix除了可以使用邮件报警之外,还可以通过多种方式把告警信息发送到指定人,例如短信报警方式,越来越多的企业开始使用Zabbix结合微信作为主要的告警方式,因