系统监控软件ganglia3.2.0

实验环境如下图所示

1.上图中三台机器均为rhel 5.8 x86_64,三台机器IP地址和主机名已按上图设置完毕

2.各软件版本如下

◆.confuse-2.7.tar.gz

◆.ganglia-3.2.0.tar.gz

◆.rrdtool-1.4.5.tar.gz

3.管理节点(admin),hosts文件已添加完毕,如下所示

192.168.10.11       admin

192.168.10.100  node1

192.168.10.101  node2

4.本次实验ganglia通信采用单播方式

【管理端(admin)安装ganglia】

一:安装所需软件

[[email protected] ~]#yum -y install apr-devel expat-devel \

> pcre-devellibxml2-devel cairo-devel \

> pango-develpython-devel

注:RHEL 6系列不能只安装python-devel,可以直接python*,还要加装perl-ExtUtils*

二:编译安装confuse

[[email protected]]# tar xzf confuse-2.7.tar.gz

[[email protected]]# cd confuse-2.7

[[email protected]]# ./configure --enable-shared --libdir=/usr/lib64

[[email protected]]# make

[[email protected]]# make install

三:编译安装rrdtool

[[email protected]]# tar xzf rrdtool-1.4.5.tar.gz

[[email protected]]# cd rrdtool-1.4.5

[[email protected]]# ./configure --prefix=/usr/local/rrdtool

[[email protected]]# make

[[email protected]]# make install

四:编译安装ganglia

[[email protected]]# ./configure --prefix=/usr/local/ganglia \

>--sysconfdir=/etc/ganglia \

>--with-librrd=/usr/local/rrdtool \

> --with-gmetad\

>--enable-gexec \

>--enable-status

[[email protected]]# make

[[email protected]]# make install

五:配置ganglia

◆.链接命令文件

[[email protected]]# ln -s /usr/local/ganglia/bin/* /usr/local/bin/

[[email protected]]# ln -s /usr/local/ganglia/sbin/* /usr/local/sbin/

◆.配置gmetad

1.[[email protected]]# cd gmetad

2.[[email protected]]# cp gmetad.init /etc/init.d/gmetad

3.[[email protected]]# chkconfig --add gmetad;chkconfig --list gmetad

gmetad          0:off   1:off  2:on    3:on    4:on   5:on    6:off

4.[[email protected]]# vi /etc/init.d/gmetad 修改GMETAD=/usr/sbin/gmetad为GMETAD=/usr/local/ganglia/sbin/gmetad

5.[[email protected]]# vi /etc/ganglia/gmetad.conf,找到第45行:data_source "my cluster" localhost,把"my cluster"可一更改为自己喜欢的名称,比如wjcyf,其他默认即可

6.创建所需目录,并设置所有者和权限

[[email protected] gmetad]#mkdir -p /var/lib/ganglia/rrds

[[email protected]]# chown nobody:nobody /var/lib/ganglia/rrds/

[[email protected]]# chmod 1777 /var/lib/ganglia/rrds/

7.启动gmetad服务

[[email protected]]# /etc/init.d/gmetad start

Starting GANGLIAgmetad:                                   [  OK  ]

◆.配置gmond

1.[[email protected]]# cd ../gmond/

2.[[email protected]]# cp gmond.init /etc/init.d/gmond

3.[[email protected]]# chkconfig --add gmond ;chkconfig --list gmond

gmond           0:off   1:off  2:on    3:on    4:on   5:on    6:off

4. [[email protected]]# vi /etc/init.d/gmond修改GMOND=/usr/sbin/gmond为GMOND=/usr/local/ganglia/sbin/gmond

5.生成默认配置文件gmond.conf

[[email protected]]# ./gmond -t >/etc/ganglia/gmond.conf

6. [[email protected]]# vi /etc/ganglia/gmond.conf,本次实验配置ganglia server节点为“单收”,配置文件需要修改的地方为下面红色文字所示,其余均默认

/* This configuration is as close to 2.5.x defaultbehavior as possible

The valuesclosely match ./gmond/metric.h definitions in 2.5.x */

globals {

daemonize =yes

setuid = yes

user = nobody

debug_level =0

max_udp_msg_len = 1472

mute = yes

deaf = no

allow_extra_data = yes

host_dmax = 0/*secs */

host_tmax = 20/*secs */

cleanup_threshold = 300 /*secs */

gexec = no

send_metadata_interval = 0 /*secs */

}

/*

* The clusterattributes specified will be used as part of the <CLUSTER>

* tag that willwrap all hosts collected by this instance.

*/

cluster {

name = "wjcyf"

owner ="unspecified"

latlong ="unspecified"

url ="unspecified"

}

/* The host section describes attributes of the host,like the location */

host {

location ="unspecified"

}

/* Feel free to specify as many udp_send_channels asyou like.  Gmond

used to onlysupport having a single channel */

udp_send_channel {

#bind_hostname= yes # Highly recommended, soon to be default.

# This option tells gmond to use a source address

# that resolves to the machine‘s hostname.  Without

# this, the metrics may appear to come from any

# interface and the DNS names associated with

# those IPs will be used to create the RRDs.

mcast_join =239.2.11.71

port = 8649

ttl = 1

}

/* You can specify as many udp_recv_channels as youlike as well. */

udp_recv_channel {

port= 8649

bind= 192.168.10.11

}

/* You can specify as many tcp_accept_channels as youlike to share

an xmldescription of the state of the cluster */

tcp_accept_channel {

port = 8649

acl {

default = "deny"

access {

ip= 127.0.0.1

mask= 32

action= "allow"

}

}

}

以下配置文件略

7.启动gmond服务

[[email protected]]# /etc/init.d/gmond start

Starting GANGLIAgmond:                                   [  OK  ]

六:安装apache配置ganglia-web

1. [[email protected]]# yum -y install httpd php php-gd

2. [[email protected]]# cp -r web/ /var/www/html/ganglia

3. [[email protected]]# cd /var/www/html/ganglia/

4. [[email protected]]# cp conf.php conf.php.bak

5.[[email protected] ganglia]#vi conf.php,更改第33行define("RRDTOOL","/usr/bin/rrdtool");为

define("RRDTOOL","/usr/local/rrdtool/bin/rrdtool");

6.创建所需目录,并设置所有者和权限

[[email protected]]# mkdir /var/lib/ganglia/dwoo

[[email protected]]# chown apache:apache /var/lib/ganglia/dwoo/

[[email protected]]# chmod 777 /var/lib/ganglia/dwoo/

7. [[email protected]]# vi /etc/httpd/conf/httpd.conf,把第256行#ServerName www.example.com:80前面的#号去掉

8.启动apache服务

[[email protected]]# /etc/init.d/httpd start ; chkconfig httpd on

Startinghttpd:                                            [  OK  ]

七:访问ganglia server

1.http://192.168.10.11/ganglia,因为此服务器被配置为“单收”,所以会出现下面的网页显示(有被监控端后,显示正常)

【被监控端安装ganglia】

一:安装所需软件

[[email protected] ~]#yum -y install apr-devel expat-devel pcre-devel python-devel

二:编译安装confuse

[[email protected]]# tar xzf confuse-2.7.tar.gz

[[email protected]]# cd confuse-2.7

[[email protected]]# ./configure --enable-shared --libdir=/usr/lib64

[[email protected]]# make

[[email protected]]# make install

三:编译安装ganglia

[[email protected]]# ./configure --prefix=/usr/local/ganglia \

>--sysconfdir=/etc/ganglia \

>--enable-gexec \

>--enable-status

[[email protected]]# make

[[email protected]]# make install

四:配置ganglia

1.创建ganglia配置文件存放目录

[[email protected] ganglia-3.2.0]#mkdir /etc/ganglia

2.[[email protected]]# cd gmond/

3.[[email protected]]# cp gmond.init /etc/init.d/gmond

4.[[email protected]]# chkconfig --add gmond ;chkconfig --list gmond

gmond           0:off   1:off  2:on    3:on    4:on   5:on    6:off

5. [[email protected]]# vi /etc/init.d/gmond修改GMOND=/usr/sbin/gmond为GMOND=/usr/local/ganglia/sbin/gmond

6.生成默认配置文件gmond.conf

[[email protected]]# ./gmond -t >/etc/ganglia/gmond.conf

7.[[email protected]]# vi /etc/ganglia/gmond.conf,本次实验配置被监控节点为“单发”,配置文件需要修改的地方为下面红色文字所示,其余均默认

/* This configuration is as close to 2.5.x defaultbehavior as possible

The valuesclosely match ./gmond/metric.h definitions in 2.5.x */

globals {

daemonize =yes

setuid = yes

user = nobody

debug_level =0

max_udp_msg_len= 1472

mute = no

deaf = yes

allow_extra_data = yes

host_dmax = 86400/*secs */

host_tmax = 20/*secs */

cleanup_threshold = 300 /*secs */

gexec = no

send_metadata_interval= 300 /*secs */

}

/*

* The clusterattributes specified will be used as part of the <CLUSTER>

* tag that willwrap all hosts collected by this instance.

*/

cluster {

name = "wjcyf"

owner ="unspecified"

latlong ="unspecified"

url ="unspecified"

}

/* The host section describes attributes of the host,like the location */

host {

location ="unspecified"

}

/* Feel free to specify as many udp_send_channels asyou like.  Gmond

used to onlysupport having a single channel */

udp_send_channel {

host= 192.168.10.11

port= 8649

}

以下配置文件略

8.启动gmond服务

[[email protected] ~]#/etc/init.d/gmond start

注:node2操作同node1

五:重新访问ganglia server,则可正常显示node1和node2的信息,如下列图中所示

碰到的问题

  1. 在启动/etc/init.d/gmond服务时报错:gmond dead but subsys locked

A:原来是在目录/etc/ganglia/conf.d/下有个文件modpython.conf,我这样做了一个备份cp modpython.conf ~modpython.conf的缘故,删除~modpython.conf后,gmond服务正常启动

时间: 2024-10-05 23:23:13

系统监控软件ganglia3.2.0的相关文章

系统监控软件Ganglia的安装

1.实验环境 Centos6.4 2.安装rrdtool(注rrdtool-1.5.3不支持3.6.1) 1 2 #安装ganglia相关包 yum -y install apr-devel apr-util check-devel cairo-devel pango-devel libxml2-devel rpmbuild glib2-devel dbus-devel freetype-devel fontconfig-devel gcc-c++ expat-devel python-deve

zabbix系统监控部署(上)

一.为什么要用zabbix zabbix 是最近比较流行的一款开源的系统监控软件,他的特点是配置简单,可以直接通过web界面进行管理和维护,同时能够自定义监控的数据和图形,从使用上使比较轻松的,但是她也有不足的地方,如报警功能比较弱,对于一些特别出图需求无法做到.在实际的生产场景中,可以根据自己的需求进行合理的选择. 二.zabbix的安装 zabbix官方更新版本的速度是比较快的,到目前为止已经更新到了3.4的版本,最新的版本还是测试版,在生产环境我们最好使用3.2的稳定版本.对于3.0以上的

Ganglia3.6.0,nginx+php搭建gweb,监控Hadoop2.2 和 Hbase0.98.1

服务端(master): 安装 ganglia ganglia-devel ganglia-gmetad ganglia-gmond ganglia-web ganglia-gmond-python rrdtool httpd php 客户端(slave) : 安装 ganglia-gmond 1 安装Ganglia  yum加入 epel 源 >rpm -Uvh http://dl.fedoraproject.org/pub/epel/6/x86_64/epel-release-6-8.noa

基于墨刀的视频编辑软件Xedit 1.0原型化系统

该产品基于墨刀设计,运行环境ios,运行平台ipad,以下是设计思路. 共有登陆.注册.视频.主页.播放.个人信息这六模块. 首先是登陆和注册模块,登陆分为账号登陆和访客登陆,账号登陆可以将用户的视频保存到服务器上,而访客登陆只能将视频保存到用户本地.之后进入主页端,这将是我们的工作目录,在这里我们可以新建项目并导入视频,主页的顶部状态栏共有三个按钮,分别是视频,项目和个人信息.视频用于查看已经编辑过的视频,项目用于查看已经建立的项目,个人信息用于查看账号的信息.演示如下. 接下来我新建一个项目

两种监控软件ganglia与zabbix各自的搭建

一.  Ganglia的搭建 Ganglia是一个分布式的,监控服务器,集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标. Ganglia的强大在于:ganglia服务端能够通过一台客户端收集到同一个网段的所有客户端的数据,ganglia集群服务端能够通过一台服务端收集到它下属的所有客户端数据.这个体系设计表示一台服务器能够通过不同的分层能够管理上万台机器.这个功能是其他mrtg,nagios,cacti所不

监控软件之二nagios

Nagios Nagios是一款开源的免费网络监视工具,能有效监控Windows.Linux和Unix的主机状态,交换机路由器等网络设备,打印机等.在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知. 功能介绍 Nagios 可以监控的功能有: 1.监控网络服务(SMTP.POP3.HTTP.NNTP.PING等): 2.监控主机资源(处理器负荷.磁盘利用率等): 3.简单地插件设计使得用户可以方便地扩展自己服务的检测方法: 4.并行服务检查机

Nagios 系统监控

Nagios 系统监控 Nagios 是一款免费的开源 IT 基础设施监控系统,功能强大,灵活性强,能有效监控 Windows.Linux.VMware 和 Unix 主机状态,交换机.路由器等网络设置等.一旦主机或服务状态出现异常时,会发出邮件或短信报警第一时间通知 IT 运营人员,在恢复后发出正常的邮件或短信.Nagios 结构简单,可维护性强,提供一个可选的基于浏览器的 Web 界面,方便管理人员查看系统的运行状态,网络状态.服务状态.日志信息,以及其它异常现象. 一.Nagios 结构简

Linux 系统监控、诊断工具-top,vmstat,iostat,iotop

1.问题: 最近在做日志的实时同步,上线之前是做过单份线上日志压力测试的,消息队列和客户端.本机都没问题,但是没想到上了第二份日志之后,问题来了: 集群中的某台机器 top 看到负载巨高,集群中的机器硬件配置一样,部署的软件都一样,却单单这一台负载有问题,初步猜测可能硬件有问题了. 同时,我们还需要把负载有异常的罪魁祸首揪出来,到时候从软件.硬件层面分别寻找解决方案. 2.排查: 从 top 中可以看到 load average 偏高,%wa 很高,%us 偏低: 从上图我们大致可以推断 IO

性能测试之开源的性能监控软件

对 于系统和网络管理员来说每天监控和调试Linux系统的性能问题是一项繁重的工作.在IT领域作为一名Linux系统的管理员工作5年后,我逐渐认识到监 控和保持系统启动并运行是多么的不容易.基于此原因,我们已编写了最常使用的18个命令行工具列表,这些工具将有助于每个Linux/Unix 系统管理员的工作.这些命令行工具可以在各种Linux系统下使用,可以用于监控和查找产生性能问题的原因.这个命令行工具列表提供了足够的工具,您可以 挑选适用于您的监控场景的工具. 1.Top-Linux进程监控 Li