nagios报警延迟的解决--flapping state

这个问题是在测试中发现的。因为要在服务器上布置nagios用来监控oracle,可是发现手动shutdown数据库后能够很快报警,但是再startup后就不是很及时,有时会延迟很久。经过研究发现了这个情况,现贴出来与大家分享。


注意看那个类似云朵的图标,那个就是在提示状态抖动,也就是flapping state检测开启了。而一旦开启,就会temporarily suppres notifications。

报警延迟是由于host or service状态不稳定,nagios称之为flapping state
在nagios的主配置文件nagios.cfg中,有如下内容:
# FLAP DETECTION OPTION
# This option determines whether or not Nagios will try
# and detect hosts and services that are "flapping".  
# Flapping occurs when a host or service changes between
# states too frequently.  When Nagios detects that a 
# host or service is flapping, it will temporarily suppress
# notifications for that host/service until it stops
# flapping.  Flap detection is very experimental, so read
# the HTML documentation before enabling this feature!
# Values: 1 = enable flap detection
#         0 = disable flap detection (default)

enable_flap_detection=0#虽然文档里说默认是0,但实际为1.改为0之后就解决了flapping state,并且解决了临时suppress notifications的问题

# FLAP DETECTION THRESHOLDS FOR HOSTS AND SERVICES
# Read the HTML documentation on flap detection for
# an explanation of what this option does.  This option
# has no effect if flap detection is disabled.

low_service_flap_threshold=5.0
high_service_flap_threshold=20.0
low_host_flap_threshold=5.0
high_host_flap_threshold=20.0

时间: 2024-10-12 05:41:33

nagios报警延迟的解决--flapping state的相关文章

限制Nagios报警次数

用escalations限制Nagios报警次数 整合的飞信之后,如果出现问题未能即使解决的话,那么后果将十分“杯具”,每五分钟你将收到一条报警短信,你的邮箱也会被报警邮件塞满.nagios官方也想到了这个问题,于是他们给出了解决办法,http://nagios.sourceforge.net/docs/3_0/escalations.html,这里是官方的说明,以下是我的做法. 首先编辑contact.cfg,把原有的配置复制一份在下面,变成:define contact{        co

nagios 报警

nagios --> plugins ( 插件 ) --> (host ,service)( 主机,服务 ) --> 返回值( 0--成功,1--警告,2--紧急 ,3--不知道 )--> web **********************************************************************************************************************************              

CentOS下nagios报警飞信部署四步走

CentOS下nagios报警飞信部署四步走 今天 帮群里一兄弟配了下nagios上的飞信,这个东西 我个人感觉还是很实用的,不过好久没配了,今天配置了一遍,顺便 就把过程记录下来了,供大家学习!!! 一.安装飞信 cd /root/toolswget http://ebook.elain.org/tools/fetion20101205.tar.gz 安装步骤略,软件包中有添加要接收报警短信的手机号为飞信好友 /usr/local/fetion/fetion --mobile=137xxxxx

2. 怎么根据nagios报警做出调整的

怎么根据nagios报警做出调整的 nagios的状态还有怎么添加监控服务 怎么监控CPU的状态 从什么时候接触linux的?都用过哪些系统?Oracle接触吗?了解多少?17 年; centos.ubuntu.fedroa.debian;接触过:大概 都用过什么系统?Centos Centos.ubuntu.红旗用吗?用过 Linux用的什么发行版本?Centos 做过NAGIOS吗? 都用它监控什么?1.本机的运行状态 2.本机的服务的运行状态 3.远程主机[可以是linuc/unix主机也

mysql 主从复制延迟及解决

qps 每秒处理的查询数tps 每秒处理的事务数IOPS,每秒磁盘进行的I/O操作次数 一 延迟的原因 主库并发量大,而从库复制是单线程,从库过多,主从系统配置不当,cpu,内存等,慢sql过大多,大的事物,网络延迟,跨公网的主从复制很容易导致主从复制延迟 二解决方法 1.适当数量的从库,3-5个,从库配置更好的硬件,网络配置等 2.将大事物拆分成多个小事物进行提交,表加主键,否在会全表扫描 3.mysql 5.7.19 + 版本支持并行复制 # slave 从表配置 slave-paralle

counter服务报警问题分析解决

counter服务介绍:    我们sae这边counter服务给用户提供的功能为计数器服务,使用的软件为redis.而我们对counter服务的监控,是通过monitor来做的,主要操作就是set,get,delete,increase,create,remove等操作.而counter报警问题,之前也存在,大概两三天会有一次报警. 报警问题主要分为如下两个阶段: 一,某天counter服务频繁报警:    是因为之前monitor的counter监控只监控了com组webruntime, 把

mrtg监控交换机路由器流量以及nagios报警

1.交换机开启snmp协议 2.安装mrtg yum -y install mrtg 3.配置mrtg (1)创建配置文件,若有多个交换机,可对每个交换机创建相应的配置文件 mkdir -p /usr/local/mrtg cfgmaker -output=/usr/local/mrtg/switch.cfg [email protected]交换机IP 此时生成的switchw.cfg配置文件,记录着所监控交换机的型号,所有正在使用的端口,vlan,当前的速率等信息. 这点需要赞一下,不用我们

MySQL出现同步延迟如何解决?优化?

工作中常常遇到的问题,叫我很是头疼,稍稍整理了个方案. 1.主从复制的从库太多导致复制延迟 优化:建议从库数量3-5个为宜(具体看自己硬件配置)   2.从库硬件比主库硬件差 优化:提升硬件性能   3.慢SQL语句过多 优化:SQL语句执行时间太长,需要优化SQL语句(需要联系DBA开发共同商讨优化语句)   4.主从复制的设计问题 优化:主从复制单线程,可以通过多线程IO方案解决:另外MySQL5.6.3支持多线程IO复制.   5.主从库之间的网络延迟 优化:尽量链路短,提升端口带宽  

nagios邮件报警配置

搭建nagios的目的就是为了他的报警系统,nagios据我所了解可以有三种报警: 一.声音报警 二.电子邮件报警 三.手机短讯报警 下面是我的邮件报警的配置过程: 1.开启系统自带的sendmail邮件系统 service sendmail start 如果没有安装,可以yum一下 yum install -y sendmail* service sendmail restart 测试发送邮件: echo "test" | mail [email protected] 我系统在关掉i