企业监控利器nagios应用终结篇

1.nagios告警

这一篇我们聊聊nagios监控告警,我们知道nagios特点就是强大的告警功能,这也是它最大的特色,虽然有人说配置基于文本,不好维护,
不像zabbix可以web端添加主机信息,但如果善用脚本,批量配置千百台主机和服务也是很容易的事,nagios支持多种告警模式,如邮件、微信、短信和电话告警。
这也是比较常用的告警方式。
nagios监控告警配置文件contacts.cfg
define contact{
contact_name nagiosadmin
use generic-contact
alias Nagios Admin
email [email protected]
}

         也可以配置http短信网管报警
         command.cfg中定义

模板中定义
http短信网关报警
define contact{
contact_name nagiosadmin
use generic-contact
alias Nagios Admin
email [email protected]
pager xxxxxxxxx
}
在本次测试环境中,我选用的是110告警,配置短信邮件微信及电话告警,免费服务会有次数限制,企业监控环境建议根据实际情况购买服务。

http://www.110monitor.com/ 手机注册登陆,创建nagios应用,该平台可以配置nagios、zabbix等主流监控平台。

根据配置步骤进行配置,然后设置通知策略。关闭一台主机服务,收到短信等告警信息如下图。


当然还可以设置电话告警,该场景特别适用紧急业务和晚上告警通知。
也可以通过该平台的协作策略,采用钉钉机器人告警,还可以认领指派。配置过程该平台有说明。实现的效果如下图。

2.nagios补充

每次修改过你的配置文件,你应该运行一次检测程序来验证配置的正确性。在运行你的Nagios程序之前这是很重要的,否则的话会导致Nagios服务因配置的错误而关闭。
为验证你配置,运行Nagios带命令行参数 -v,象这样:
/usr/local/nagios/bin/nagios -v /usr/local/nagios/etc/nagios.cfg
初始化脚本:最简单的启动Nagios守护进程的方式是使用初始化脚本,象这样:
/etc/rc.d/init.d/nagios start
手工方式:你可以手动地启动Nagios守护进程,用命令参数-d,象这样:
/usr/local/nagios/bin/nagios -d /usr/local/nagios/etc/nagios.cfg
快速启动选项
介绍
只有很少几件事可以减少Nagios的启动或重启总时间。加速启动方法包括有移除些负担还包括加快配置文件处理过程。
利用这些技术在如下一种或几种情况时特别有效:

大型安装配置
复杂地配置(过度地利用模板特性)
需要进行频繁重启动的安装模式
背景
每次Nagios启动和重启时,在它着手进行监控工作之前必须要处理配置文件。启动过程中的配置处理包括如下几步:

读入配置文件
解析模板定义
重粘连("Recombobulating")对象(是我想到的应做各种工作)
复制对象定义
继承对象属性
对象定义排序
验证对象关联关系的完整性
验证回路
和其他...
当有很大的或是很复杂的配置文件要处理时有几步非常消耗时间的。有没有加快这些的办法?当然有!

评估启动时间
在做让启动速度更快的事情之前,需要看看可能性有多少和是否有必要涉足此事。这个比较容易-只是用-s命令行开关启动Nagios以取得计时和调度信息。

下面是个输出样例(做过精减,只是显示了有关部分),在这个例子中,假定Nagios配置为对25个主机和超过10,000个服务进行监控。

/usr/local/nagios/bin/nagios -s /usr/local/nagios/etc/nagios.cfg
Nagios 3.0-prealpha
Copyright (c) 1999-2007 Ethan Galstad (http://www.nagios.org)
Last Modified: 01-27-2007
License: GPL

Timing information on object configuration processing is listed
below. You can use this information to see if precaching your
object configuration would be useful.

Object Config Source: Config files (uncached)

OBJECT CONFIG PROCESSING TIMES (* = Potential for precache savings with -u option)

Read: 0.486780 sec
Resolve: 0.004106 sec
Recomb Contactgroups: 0.000077 sec

Recomb Hostgroups: 0.000172 sec
Dup Services: 0.028801 sec

Recomb Servicegroups: 0.010358 sec
Duplicate: 5.666932 sec

Inherit: 0.003770 sec
Recomb Contacts: 0.030085 sec

Sort: 2.648863 sec
Register: 2.654628 sec
Free: 0.021347 sec
TOTAL: 11.555925 sec
= 8.393170 sec (72.63%)
estimated savings
Timing information on configuration verification is listed below.
CONFIG VERIFICATION TIMES (* = Potential for speedup with -x option)

Object Relationships: 1.400807 sec
Circular Paths: 54.676622 sec *
Misc: 0.006924 sec

TOTAL: 56.084353 sec * = 54.676622 sec (97.5%) estimated savings

OK,看看发生了什么。先看汇总信息,大概有11.6秒用于处理配置文件有56秒来验证配置。这意味着每次用这个配置启动或重启Nagios时,它大约会有68秒来做启动事项而不会做任何监控的事情!如果是在定制配置Nagios过程中也是不可容忍的。

那么怎么办?看一下输出内容,如果运用了优化选项,Nagios将可以在配置读取过程节省大约8.4秒而在验证过程可节省63秒。

哇!从68秒到只有5秒?!是的!看看下面是怎么做到的。

预缓存对象配置
Nagios可在解析配置文件过程中做些加速,特别是当配置中使用了模板来做继承等的时候。为降低Nagios解析配置文件的处理时间可用Nagios预处理与预缓存配置文件的功能。

当用-p命令参数来运行Nagios时,Nagios将读入配置文件,处理后将配置结果写入预缓存文件(由主配置文件中precached_object_file域指定文件位置)。该预缓存配置文件将包含了预处理后的信息将使Nagios处理配置文件更容易和快捷。必须把-p参数选项与-v或-s命令参数一起使用,如下例。注意要做预缓存配置文件之前配置应是已被验证过的。

/usr/local/nagios/bin/nagios -pv /usr/local/nagios/etc/nagios.cfg

预缓存配置文件有大小明显地比原有配置文件大。这是正常的由设计初衷决定的。
一旦预缓存对象配置文件创建,可以启动Nagios时带上-u命令行选项以让它使用预缓存配置文件而不是配置文件本身。
/usr/local/nagios/bin/nagios -ud /usr/local/nagios/etc/nagios.cfg
如果更改了配置文件,必须在Nagios重启动前要重新验证和重建预缓存配置文件。如果没有重构建预缓存配置文件,Nagios将使用旧配置运行因为是由旧配置生成的预缓存文件,而不是用新的原始配置文件。
跳过回路检测
/usr/local/nagios/bin/nagios -xd /usr/local/nagios/etc/nagios.cfg

联合起来使用
按照下面步骤将会使用预缓存配置文件并且跳过回路检测以充分加速启动。

1、验证配置文件并生成预缓存配置文件,用如下命令:

/usr/local/nagios/bin/nagios -vp /usr/local/nagios/etc/nagios.cfg

2、如果Nagios正在运行,停掉它;

3、启动Nagios,让其使用预缓存配置文件而且跳过回路检测:

/usr/local/nagios/bin/nagios -uxd /usr/local/nagios/etc/nagios.cfg

原文地址:http://blog.51cto.com/tuwei/2312484

时间: 2024-07-31 13:11:51

企业监控利器nagios应用终结篇的相关文章

企业监控利器nagios应用续集

上篇讲到了nagios服务端和客户端的安装,本篇继续将nagios的配置.出图及插件开发. 1.配置server端nagios监控服务 nagios服务端安装后,安装目录是/usr/local/nagios,主配置文件是/usr/local/nagios/etc/nagios.cfg,主机配置等相关配置文件以.cfg结尾.主配置文件中定义一些需要监控的配置,数据采集等,cgi.cfg文件定义一些如页面刷新时间,用户访问权限控制等.配置主配置文件nagios.cfg找到cfg_file部分,进行设

企业监控利器nagios应用开篇

1.监控软件分类 mrtg:老牌的监控系统,网站带宽流量图,历史趋势图,也可以对资源进行监控,现在用的不多cacti:特色是绘图,历史趋势图,通过插件可以实现报警.故障分析上较差,而且报警机制有待完善.nagios:特点是专注与报警,也可以配置pnp,cacti,hyperic出图等.特别适合监控大量服务器上面的服务是否正常,通过插件实现页面配置管理.zabbix:新出的出图报警软件.有页面配置管理,通过php程序绘图.对服务器的资源消耗稍大.我司目前使用的是nagios监控系统. 2.nagi

监控利器Nagios之一:监控本地NFS和外部HTTP、MySQL服务

监控利器Nagios之一:监控本地NFS和外部HTTP.MySQL服务 Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设置,打印机等.在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知. Nagios的特点: 1.监控服务http.MySQL.nfs.tcp.ping等 2.监控主机资源cpu.负载.I/O.虚拟及内存磁盘利用率等 3.支持邮件微信等报警通信. 4.可选we

监控利器Nagios之二:Nagios的细致介绍和监控外部服务器的私有信息

监控利器Nagios之二:Nagios的细致介绍和监控外部服务器的私有信息 Nagios的监控对象的定义和对被监控设备的动作命令是分开的.一个是主程序包,一个是插件包.先来说说nagios主程序nagios-plugins插件和nrpe软件的用处, Nagios主程序: Nagios主程序提供一个的只是一个监控平台,真正用作工作的并不是它,而是他的插件.在Nagios 安装完毕后,默认的配置文件在/usr/local/nagios/etc目录下.里面定义了nagios能调用的命令.对打印机和交换

运维监控利器Nagios之:安装nagios

一.安装前准备 (1)创建nagios用户和用户组 [[email protected] ~]#useradd -s /sbin/nologin nagios [[email protected] ~]#mkdir /usr/local/nagios [[email protected] ~]#chown –R  nagios.nagios /usr/local/nagios (2)开启系统sendmail服务 在nagios监控服务器上开启sendmail服务的主要作用是让nagios在检测到

4. 监控利器nagios手把手企业级实战第三部

1.nagios图形监控显示和管理服务器 虽然能显示,能报警.但是我们企业工作中需要一个历史趋势图. nagios只开放核心,插件是单独的形式,图像也一样,是插件或者整合的方式.所以可能看起来很多,这种方式叫做弱耦合. 2.Pnp安装图形监控曲线(服务器端) php出图软件官方站点为:http://www.php4nagios.org 先执行yum安装下面基础pnp软件需要的包,如果有重复的再执行下也不会有问题. 1)图形显示的依赖库:yum install cairo pango zlib z

运维监控利器nagios安装与配置Nagios监控系统(一)

nagios 的功能原理 我这里就不介绍了 我们主要讲述安装配置 使用nagios对服务器进行监控,其特点可实时实现手机短信.电子邮件.MSN.飞信报警. 按照上面的命令写 我就不用多说什么了 如果你安装的最小化版的centos 可能会提示没有sendmail 这时候使用 yum -y install sendmail 安装 /etc/init.d/sendmail restart 启动服务 我在指定的时候 提示图下 这是没安装gcc插件  yum -y install gcc 在执行 ./co

Nagios企业监控讲解

Nagios企业监控讲解 一.关于Nagios Nagioss 是经典老牌子监控,伴随着一代运维工程师们路路成长,即便到了现在也广泛在企业中使用.Nagios有三个特点决定了它屹立不倒的优势: 第一: Nagios跟其他监控产品比起来是部署和配置最便便捷,没有之一,且最容易易入门的开源监控产品. 企业的老总们最喜欢的就是省时快速的完成工作 第二:Nagios对于各种基础服务层面的监控就是两个字"完善"这得益于Nagios的很多对于监控项目的基本计算方式都十分的直接有效,且非常符合一般人

开发人员学Linux之终结篇:大型系统开发经验谈

1.前言这篇文章来源于我的一个ppt,而这个ppt是源于一个朋友的一次邀请,朋友邀请我为一个公司做一堂大约2小时的技术讲座,我选定的方向是如何开发一个大型系统,在这里我对大型系统的定义为日均PV在千万级以上,而京东和淘宝这类则属于巨型系统了.因此在本篇中讲述的都是基于一些开源免费的技术实现,至于那些通过F5硬件加速.DNS来实现负载均衡.CDN加速等需要花钱购买的技术或者服务则不再本篇介绍范围之类.本来此篇是作为<开发人员学Linux>系列的终结篇最后出现的,但是考虑到在此过程中我可能会由于时