ganglia使用nagios告警

1.复制所需脚本到nagios的脚本目录,并设置权限

  cp -fr ./ganglia-3.7.1/contrib/check_ganglia.py   /usr/local/nagios/libexec/
    chown nagios.nagios /usr/local/nagios/libexec/check_ganglia.py
    chmod 755  /usr/local/nagios/libexec/check_ganglia.py

2.添加check_ganglia的命令

编辑commands.cfg文件,添加如下内容

# ‘check_ganglia‘ command definition
define command {
        command_name check_ganglia
        command_line $USER1$/check_ganglia.py -h $HOSTNAME$ -m $ARG1$ -w $ARG2$ -c $ARG3$
}

3.check_ganglia.py 使用方法:

./check_ganglia.py -h

check_gmond: option -h requires argument

Usage: check_ganglia -h|--host= -m|--metric= -w|--warning= -c|--critical= [-s|--server=] [-p|--port=]

-h :指定监控的nodes

-m  指定监控的metric

-w 指定 wanning 值

-c 指定错误值

-s 指定ganglia 的server

-p 指定端口

/usr/local/nagios/libexec/check_ganglia.py  -h puppet.sa.beyond.com -m load_one -w 1 -c 2

4. 根据脚本使用方法,进行配置监控

define service {
           use                  beyond-service
          host_name             test.sa.beyond.com
         service_description    check_load_one
        check_command           check_ganglia!load_on!1!2
}
define service {
           use                  beyond-service
          host_name             test.sa.beyond.com
         service_description    check_load_five
        check_command           check_ganglia!load_five!0.9!1
}

define service {
           use                  beyond-service
          host_name             test.sa.beyond.com
         service_description    check_load_fifteen
        check_command           check_ganglia!load_fifteen!1!2
}

5.打开nagios界面,可以看到效果

6. 在nagiosUI上添加ganglia的图

如果主机和服务名在ganglia和nagios中保持一致,那么只需要使用内置的nagios宏就可以将任意服务的action_url指回ganglia的graph.php文件,这样用户在点击nagiosUI中的action_url来请求某项服务时,就可以获得这个服务在ganglia的图标形式的数据

例如:某项服务 load_one我们可以用下面语句来获取ganglia的数据

http://203.130.45.173:9100/ganglia/graph.php?c=beyond&h=puppet.sa.beyond.com&m=load_one&r=hour&z=large

c表示主机所在的cluster

h表示主机    可以使用nagios内置宏hostname来传递

m表示metric   可以使用nagios内置宏 servicedesc 来传递

由于在nagios中没有集群的概念,所以需要自动宏来传递主机所在的cluster。nagios自定义宏以下划线开头,如下

最后 为统一管理,可以在模版上加如action_url

重启nagios。会在nagios的ui上看到图标,点击进去之后,是ganglia的图表

<wiz_tmp_tag id="wiz-table-range-border" contenteditable="false" style="display: none;">

来自为知笔记(Wiz)

原文地址:https://www.cnblogs.com/pycode/p/9495866.html

时间: 2024-10-15 06:39:44

ganglia使用nagios告警的相关文章

Linux集群监控工具简介:Ganglia和Nagios

11年时候,曾经对 Ganglia 和 Nagios有一定接触,这是两个用于监视数据中心的工具.这两个工具被大量用于高性能计算(HPC)环境中,但是它们对于其他环境也具有很大的吸引力(例如云.呈现集群和托管中心).此外,两者对监视的定义也采取了不同的侧重点.Ganglia 更多地与收集度量数据并随时跟踪这些数据有关,而 Nagios 一直致力于成为一种报警机制. 真么多年过去了,这两个工具还是挺有用的.,这里有一定的介绍:http://os.51cto.com/art/201104/255361

完美集群监控组合ganglia和nagios

Ganglia是伯克利开发的一个集群监控软件.可以监视和显示集群中的节点的各种状态信息,比如如:cpu .mem.硬盘利用率, I/O负载.网络流量情况等,同时可以将历史数据以曲线方式通过php页面呈现. 而ganglia又依赖于一个web服务器用来显示集群状态,用rrdtool来存储数据和生成曲线图,需要xml解析因此需要expat,配置文件解析需要libconfuse.安装apche的httpd还需要支持php4以上,同时还有一些依赖软件. ganglia作为一款最常用的Linux环境中的监

结合一个nagios告警浅谈solaris的SVM

现在的90后运维,大多懂linux的lvm,估计很少有人懂solaris的svm了.在N年前,在linux x86还没有雄起的时候,其实aix/hp/sun三大主机巨头都有自己的一套存储管理机制和软件,其中sun的就是svm.除了各自专门的存储管理软件,还有第三方的商业存储管理软件,比如veritas,也可以用来管理solaris的存储,不过这些商业软件,在如今开源产品的冲击下,日子是远不如以前风光了. ok,废话扯完.看一个nagios告警: messages.0:Jul 31 15:06:4

nagios告警发不出问题解决

公司最近搭建的nagios平台发不出告警邮件,经检查配置文件没问题,查看mail日志发现如下错误: 后来查询好hostname名称和/etc/hosts名称不一样. 然后试着在/etc/hosts下添加 注:100.105.0.17为本机IP 后保存,正常收到邮件

nagios 自动恢复告警通知

nagios中在nagios告警时,有时候会禁用告警通知,监控恢复正常时禁用通知没有取消,导致下次监控不正常时没有告警通知:为防止这种情况,编写了恢复告警通知脚本,添加了恢复此类告警通知的例行任务 代码如下: #!/usr/bin/env python #Desc: to change services'notification status(0 or 1) if current state of service is ok while enable_notification is False

nagios+ganglia分布式监控

nagios+ganglia监控批量主机 之前我们学习用nagios+cacti实现网络监控报警,如果是传统的运维工作,有这个工具就足够强大了.但是对于分布式系统的开发+运维人员(DevOps?),更关心的是掌握分布式系统的性能和可用性,根据数据做出性能调整.升级.扩容等的决策,从而保证基础设施服务能够满足不断增长的业务需求.与Cacti.Nagios.Zabbix等工具相比,Ganglia更关注整个集群的性能和可用性.可以用于集群的性能监控.分析和优化. Ganglia就是这样一种工具.Gan

Nagios全方位告警接入-电话/微信/短信都支持

百度告警平台地址: http://gaojing.baidu.com 联系我们: 邮箱:[email protected] 电话:13924600771 QQ群:183806029 Nagios接入 对于使用Nagios的用户,要接入百度告警非常简单,只需要按以下四步骤进行配置,就可以使用短信.电话.微信来接收Nagios告警信息接入步骤: Step 1:在百度告警中配置服务和升级策略 Step 2:在Nagios中配置command.cfg,配置百度告警接方式 Step 3:在Nagios中配

centos6.5监控平台ganglia搭建与配置

监控平台之-ganglia安装配置 小贝比尔IT技术交流网-小贝比尔 提醒:内存1G  硬盘15G(硬盘最好不要低于15G,不然安装期间会出问题) Selinux和防火墙先关闭,安装成功后再配置 1.关闭selinux  vim/etc/sysconfig/selinu更改:SELINUX=enforcing 为 SELINUX=disabled 2.关闭iptables  service iptables stop 监控主机ip:192.168.0.90 Mask:255.255.255.0

网站监控系统安装部署(zabbix,nagios)

zabbix分布式监控系统安装部署 官方网站链接 https://www.zabbix.com/documentation/2.0/manual/installation 安装环境说明 参考地址 http://mayulin.blog.51cto.com/1628315/514371 虚拟机两台 zabbix_server 192.168.50.141 zabbix_agentd 192.168.50.139 os:CentOS 6.3 x64 软件: zabbix-2.0.6 需求软件:htt