分布式监控系统ganglia配置文档

一、Ganglia的组件

Ganglia包括如下程序,他们之间通过XML格式传递监控数据,达到监控效果。

Gmetad 这个程序负责收集各个cluster的数据,并更新到rrd数据库中。

Gmond 收集本机的监控数据,发送到其他机器上。收集其他机器的监控数据,供Gmetad读取。默认监听端口8649

web front-end 一个基于web的监控界面,需要和Gmetad安装在同一个节点上,从Gmetad取数据,并且读取rrd数据库,生成图片,显示出来。

二、Ganglia的工作模式

Ganglia的收集数据工作可以工作在单播(unicast)或多播(multicast)模式下,默认为多播模式。

单播:发送自己收集到的监控数据到特定的一台或几台机器上,可以跨网段

多播:发送自己收集到的监控数据到同一网段内所有的机器上,同时收集同一网段内的所有机器发送过来的监控数据。因为是以广播包的形式发送,因此需要同一网段内。但同一网段内,又可以定义不同的发送通道。

三、Ganglia的安装

Ganglia的安装非常简单,分为监控管理端(Gmetad)和客户端(Gmond)安装两部分,已经写成安装脚本,这里不在描述。

推荐安装版本是ganglia-3.4.0,可以在http://sourceforge.net/projects/ganglia/files/下载安装。

四、Ganglia的配置

这里介绍一个简单的Ganglia配置构架,即一个监控管理端和多个客户端,我们假定gmond工作在多播模式,并且有一个Cluster1的集群,里面有10台服务器(从host1到host10),在同一个网段内。

1、监控管理端配置

监控管理端的配置文件是gmetad.conf,在安装Ganglia的etc目录下可以找到,这个文件配置非常简单,介绍如下:

data_source "Cluster1" host1 host2

xml_port 8651

interactive_port 8652

rrd_rootdir "/var/lib/ganglia/rrds"

data_source参数定义了集群名字,以及集群中的节点。由于采用multicast模式,每台gmond节点都有本Cluster1内节点机器的所有监控数据,因此不需要把所有节点写入data_source中。建议写入不低于2个,在host1节点死机的时候,会自动找host2节点取数据。

xml_port定义了一个收集数据汇总的交互端口,如果不指定,默认是8651,可以通过telnet这个端口得到监控管理端收集到的客户端的所有数据。

interactive_port 定义了Web端获取数据的端口,这个端口在配置Ganglia的web监控界面时需要指定。

rrd_rootdir参数定义了rrd数据库的存放路径,gmetad收集到监控数据后,会更新到该目录下的对应的rrd数据库中。

上面通过data_source参数定义了一个监控集群,如果要监控多个应用系统,可以通过如下方式定义:

data_source "my cluster" 10 localhost  my.machine.edu:8649  1.2.3.5:8655

data_source "my grid" 50 1.3.4.7:8655 grid.org:8651 grid-backup.org:8651

data_source "another source" 1.3.4.7:8655  1.3.4.8

在定义集群节点的时候,可以采用主机名、IP地址等形式,也可以加端口,如果不加端口的话,默认是8649端口,同时可以设定采集数据的频率,如上面的“10 localhost、50 1.3.4.7:8655”等,分别表示每隔10秒钟、50秒钟采集一次数据。

2、客户端配置

客户端监控安装完成后,配置文件位于安装Ganglia的etc目录下,名称为gmond.conf,这个配置文件稍微复杂,介绍如下:

globals {

daemonize = yes        #以后台的方式运行

setuid = yes

user = nobody          #运行gmond的用户

debug_level = 0        #调试级别

max_udp_msg_len = 1472

mute = no            #哑巴,本节点将不会再广播任何自己收集到的数据到网络上

deaf = no             #聋子,本节点将不再接收任何其他节点广播的数据包

allow_extra_data = yes

host_dmax = 0 /*secs */

cleanup_threshold = 300 /*secs */

gexec = no             #是否使用gexec

send_metadata_interval = 0

}

cluster {

name = "Cluster1"     #本节点属于哪个cluster

owner = "junfeng"     #谁是该节点的所有者

latlong = "unspecified"   #在地球上的坐标,经度、纬度?

url = "unspecified"

}

host {

location = "unspecified"

}

udp_send_channel {       #udp包的发送通道

mcast_join = 239.2.11.71   #多播,工作在239.2.11.71通道下。如果使用单播模式,则要写host = host1,单播模式下也可以配置多个udp_send_channel

port = 8649            #监听端口

ttl = 1

}

udp_recv_channel {           #接收udp包配置

mcast_join = 239.2.11.71   #同样工作在239.2.11.71通道下

port = 8649                #监听端口

bind = 239.2.11.71         #绑定

}

tcp_accept_channel {

port = 8649               #通过tcp协议监听的端口,远端可以通过链接8649端口得到监控数据

}

3、Ganglia之Web端配置

Ganglia的web监控界面是基于PHP的,因此需要安装PHP环境,PHP环境的安装不在介绍,可以在http://sourceforge.net/projects/ganglia/files/下载ganglia-web,然后放到web根目录即可,推荐下载ganglia-web-3.5.7版本。

配置ganglia的web界面比较简单,只需要修改几个php文件即可,首先第一个是conf_default.php,可以将conf_default.php重命名为conf.php,也可以保持不变,ganglia的web默认先找conf.php,找不到会继续找conf_default.php,需要修改的内容如下:

$conf[‘gmetad_root‘] = "/var/lib/ganglia"; # ganglia web根目录

$conf[‘rrds‘] = "${conf[‘gmetad_root‘]}/rrds"; #ganglia web读取rrds数据库的路径

$conf[‘dwoo_compiled_dir‘] = "${conf[‘gmetad_root‘]}/dwoo/compiled"; #需要777权限

$conf[‘dwoo_cache_dir‘] = "${conf[‘gmetad_root‘]}/dwoo/cache"; #需要777权限

$conf[‘rrdtool‘] = "/opt/rrdtool/bin/rrdtool"; #指定rrdtool的路径

$conf[‘graphdir‘]= $conf[‘gweb_root‘] . ‘/graph.d‘; #生成图形模板目录

$conf[‘ganglia_ip‘] = "127.0.0.1"; #gmetad服务器的地址

$conf[‘ganglia_port‘] = 8652; #gmetad服务器的交互式提供监控数据端口发布

五、管理ganglia

所有配置操作完成后,即可启动ganglia服务了,首先在监控管理端启动gmetad服务:

/etc/init.d/gmetad start

接着启动apache的web服务:

/usr/local/apache2/bin/apachectl start

最后在每个客户端启动gmond服务:

/etc/init.d/gmond start

时间: 2024-11-16 00:07:03

分布式监控系统ganglia配置文档的相关文章

分布式监控系统Ganglia简介及安装

一.Ganglia简介 Ganglia是一款为HPC(高性能计算) 集群设计的可扩展性 的分布式监控系统,它可以监视和显示集群中节点的各种状态信息,他由运行在各个节点上的gmond守护进程来采集 CPU.内存.磁盘利用率.I/O负载.网络流量情况等方面的数据.然后汇总到gmetad守护进程下,使用rrdtool存储数据,然后将历史数据以曲线方式通过PHP页面呈现. Ganglia监控系统由三部分组成,分别是gmond.gmetad.webfrontend gmond  一个守护进程运行在每个需要

Ganglia:分布式监控系统

Ganglia的核心包含gmond.gmetad以及一个Web前端.主要是用来监控系统性能,如:cpu .mem.硬盘利用率, I/O负载.网络流量情况等,通过曲线很容易见到每个节点的工作状态,对合理调整.分配系统资源,提高系统整体性能起到重要作用 Ganglia监控端安装 1.安装依赖的软件包 yum install ntp vim-enhanced gcc gcc-c++ flex bison autoconf automake bzip2-devel ncurses-devel zlib-

zabbix企业级分布式监控系统--zabbix-server和zabbix-agent的配置过程

首先,大家应该了解一下,什么是zabbix? Zabbix是一个分布式监控系统,支持多种采集方式和采集客户端,有专用的Agent(代理),也可以支持SNMP.IPMI.JMX.Telnet.SSH等多种协议,它将采集到的数据存放到数据库,然后对其进行分析整理,达到条件触发告警.其灵活的扩展性和丰富的功能是其他监控系统不能比的.相对来说,他的总体功能做得非常优秀,其界面也很简洁美观. 在国内,BAT的部分业务.豆瓣.58同城.PPTV.搜狐.Letv.人人.网易.小米.360等公司都在使用Zabb

《Zabbix企业级分布式监控系统》预售

<Zabbix企业级分布式监控系统>预售 一.预售网站链接如下 网站名称 链接 亚马逊 http://www.amazon.cn/3/dp/B00MN6QEYK 当当 京东 二.书籍封面如下 三.该书相关信息如下 本书的读者QQ群: Zabbix企业级分布式监控 271659981 (可申请加入,验证码:Zabbix监控) 四.随书资料 随书所带的附件托管在github上面,完全开源. https://github.com/itnihao/zabbix-book 五.书籍目录如下 第一部分Za

Hadoop配置文档

预节 在这一节中,笔者主要向大家介绍了该配置文档中,所用到的Linux命令和Linux的帮助. 终端提示信息 在Linux中,终端的每一行都有提示信息,其包含了当前终端登录的用户,当前登录的主机,当前终端所在的目录. 如:[[email protected] ~]$其格式为:[[用户名]@[hosts主机名或主机ip [当前所在路径]]$解析后可以知道,例子给的提示,实际上代表的是:当前终端登录的主机为master,所有的操作都是针对master的,登录主机的用户为frank,当前终端cd命令进

redis.conf 配置文档详解

redis 配置文档详解. 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626364656667686970717273747576777879808182838485868788899091929394959697989910010110210310410510610710810911011111211311411

Nginx配置文档具体解释

Nginx的配置文档具体解释.在这儿做个总结,以便以后使用的时间查看. 下面大部分自己整理.部分来自參考 #设置用户 #user  nobody; #启动进程数(一般和server的CPU同样) #能够使用 $ cat /proc/cpuinfo 查看内核数 worker_processes  2; #设置错误文件存放的路径 #error_log  logs/error.log; #error_log  logs/error.log  notice; #error_log  logs/error

OpenCV+VS2013+Win8+64位配置文档

配置环境 编程平台:VS2013 系统:Windows8 64位 X64架构 ? 安装OpenCV 1 下载OpenCV-2.4.9,下载网址 http://opencv.org/ 2 解压OpenCV到 D:\Program Files\OpenCV\opencv249 3 配置系统变量 添加OpenCV变量: D:\Program Files\OpenCV\opencv249\build 在Path后添加: D:\Program Files\OpenCV\opencv249\build\x6

【VMware虚拟化解决方案】VMware Horizon View Client 各平台配置文档

云桌面用户手册 XXXX部 2014年05月18日 文档版本 文档名称 XXXX公司云桌面用户手册 保密级别 商密 文档版本编号 1.0 制作人 制作日期 2014-04-24 复审人 复审日期 扩散范围 公司内部使用人员 变更记录 版本编号 版本日期 修改者 说明 文档说明 此文档为XXXX公司内部员工关于<云桌面用户手册>培训文档. 此文档只对公司内部员工传阅,并只针对公司内部员工问题给予解决. 目录 1.VMware Horizon View Client下载地址... 4 2.桌面连接