限制Nagios报警次数

用escalations限制Nagios报警次数

整合的飞信之后,如果出现问题未能即使解决的话,那么后果将十分“杯具”,每五分钟你将收到一条报警短信,你的邮箱也会被报警邮件塞满。nagios官方也想到了这个问题,于是他们给出了解决办法,http://nagios.sourceforge.net/docs/3_0/escalations.html,这里是官方的说明,以下是我的做法。

首先编辑contact.cfg,把原有的配置复制一份在下面,变成:
define contact{
        contact_name            nagiosadmin       
        use                           generic-contact   
        alias                          Nagios Admin       
        email                        [email protected] ;
        service_notification_commands   notify-service-by-email,service-notify-by-fetion 
        host_notification_commands      notify-host-by-email,host-notify-by-fetion
        pager                          13691515****
        }

define contactgroup{
        contactgroup_name         admins
        alias                               Nagios Administrators
        members                        nagiosadmin
        }

define contact{
        contact_name               scomd    
        use                             generic-contact       
        alias                            Nagios Admin      
        email                           [email protected]  
        service_notification_commands    notify-service-by-email
        host_notification_commands     notify-host-by-email
        pager                          13691515****
        }

define contactgroup{
        contactgroup_name               sysadmin
        alias                            sysadmin
        members                        scomd
        }

然后然后创建一个配置文件: escalations.cfg

#vi /usr/local/nagios/etc/objects/escalations.cfg

添加如下内容:
define serviceescalation{
host_name               scomd.com    ;被监控主机名称,多个用逗号隔开
first_notification         4           ; 第4条信息起,改变频率间隔
last_notification          0          ; 第n条信息起,恢复频率间隔
notification_interval     30         ; 通知间隔(单位:分)
contact_groups          sysadmin 
}

define serviceescalation{
host_name                  scomd.com          ;被监控主机名称    
service_description        PING            ;被监控服务名称,多个用逗号隔开 
first_notification            4
last_notification            0
notification_interval        30
contact_groups          sysadmin
}

最后,编辑nagios.cfg文件

#vi /usr/local/nagios/etc/nagios.cfg
添加:
cfg_file=/usr/local/nagios/etc/objects/escalations.cfg

检查nagios配置文件是否正确
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg

没有问题就重启nagios服务吧
service nagios restart

时间: 2024-11-06 02:33:23

限制Nagios报警次数的相关文章

nagios 报警

nagios --> plugins ( 插件 ) --> (host ,service)( 主机,服务 ) --> 返回值( 0--成功,1--警告,2--紧急 ,3--不知道 )--> web **********************************************************************************************************************************              

CentOS下nagios报警飞信部署四步走

CentOS下nagios报警飞信部署四步走 今天 帮群里一兄弟配了下nagios上的飞信,这个东西 我个人感觉还是很实用的,不过好久没配了,今天配置了一遍,顺便 就把过程记录下来了,供大家学习!!! 一.安装飞信 cd /root/toolswget http://ebook.elain.org/tools/fetion20101205.tar.gz 安装步骤略,软件包中有添加要接收报警短信的手机号为飞信好友 /usr/local/fetion/fetion --mobile=137xxxxx

2. 怎么根据nagios报警做出调整的

怎么根据nagios报警做出调整的 nagios的状态还有怎么添加监控服务 怎么监控CPU的状态 从什么时候接触linux的?都用过哪些系统?Oracle接触吗?了解多少?17 年; centos.ubuntu.fedroa.debian;接触过:大概 都用过什么系统?Centos Centos.ubuntu.红旗用吗?用过 Linux用的什么发行版本?Centos 做过NAGIOS吗? 都用它监控什么?1.本机的运行状态 2.本机的服务的运行状态 3.远程主机[可以是linuc/unix主机也

mrtg监控交换机路由器流量以及nagios报警

1.交换机开启snmp协议 2.安装mrtg yum -y install mrtg 3.配置mrtg (1)创建配置文件,若有多个交换机,可对每个交换机创建相应的配置文件 mkdir -p /usr/local/mrtg cfgmaker -output=/usr/local/mrtg/switch.cfg [email protected]交换机IP 此时生成的switchw.cfg配置文件,记录着所监控交换机的型号,所有正在使用的端口,vlan,当前的速率等信息. 这点需要赞一下,不用我们

nagios报警延迟的解决--flapping state

这个问题是在测试中发现的.因为要在服务器上布置nagios用来监控oracle,可是发现手动shutdown数据库后能够很快报警,但是再startup后就不是很及时,有时会延迟很久.经过研究发现了这个情况,现贴出来与大家分享. 注意看那个类似云朵的图标,那个就是在提示状态抖动,也就是flapping state检测开启了.而一旦开启,就会temporarily suppres notifications. 报警延迟是由于host or service状态不稳定,nagios称之为flapping

网站监控系统安装部署(zabbix,nagios)

zabbix分布式监控系统安装部署 官方网站链接 https://www.zabbix.com/documentation/2.0/manual/installation 安装环境说明 参考地址 http://mayulin.blog.51cto.com/1628315/514371 虚拟机两台 zabbix_server 192.168.50.141 zabbix_agentd 192.168.50.139 os:CentOS 6.3 x64 软件: zabbix-2.0.6 需求软件:htt

如何更改nagios监控默认的检查时间

/usr/local/nagios/etc/nagios.cfg: interval_length 表示时间单位,默认为60,即1分钟 /usr/local/nagios/etc/objects/services.cfg:(新版本不存在这个文件) normal_check_interval 表示重新检测的时间间隔,默认为3个时间单位 check_interval 与normal_check_interval的作用一样,只能在3.X中使用 retry_check_interval 重试时间 max

实战Nagios网络监控(3)——Nagios 微信报警

1. 下载微信公众平台私有接口 # yum install -y git # git clone https://github.com/lealife/WeiXin-Private-API 2. 修改微信公众平台私有接口代码,以配合 nagios 报警 # cp -r WeiXin-Private-API /usr/local/nagios/libexec/weixin # chown -R nagios.nagios /usr/local/nagios/libexec/weixin # cd

nagios 流量监控和报警的shell脚本

上下文:我们平台的监控系统用的是cacti+nagios.之前没有加流量异常报警设置,cacti上到是有插件可以时间报警,但是无法使用我们自己的短信接口(nagios用的购买的短信接口),所以想自己写一个脚本配合nagios实现基本的流量异常报警. 脚本思路:/proc/net/dev取出当前流经网卡的(接收和发送)的kb总数量,在检测间隔时间后再次读取这两个值,相减既是间隔时间段内的增量,再根据此增量做计算,算出间隔时间内的平均流量,和基准流量作比较,触发nagios报警事件 局限性:我们只检