Ganglia监控spark1.6.1

Ganglia监控spark1.6.1

  Spark的Metrics系统允许用户把Spark metrics信息报告到Ganglia,gmond服务收集metrics信息,最后统一汇总到gmetad并通过web界面呈现。主要着重于如何配置ganglia以及spark的metrics,至于如何编译spark支持ganglia以及ganglia的安装另行详述。

1.编译spark支持ganglia

spark默认不把ganglia相关的类包含在发行包中 ,所以在官网上下载的包是不支持ganglia的,所以我们要加上-Pspark-ganglia-lgpl自行编译,可以看到在最后打包出来的spark-assembly-xxxx.jar包中包含了ganglia相关的类:

2.安装并配置ganglia

自行安装ganglia相关服务:gmetad,gmond以及ganglia-web。以配置ganglia单播为例配置gmetad,gmond

2.1配置服务端gmond.conf

gmond.conf配置文件位于/etc/ganglia/gmond.conf,编辑配置文件3个地方:

cluster {
  name = "unspecified"   #集群名称
  owner = "unspecified"
  latlong = "unspecified"
  url = "unspecified"
}
udp_send_channel {
  #mcast_join = 239.2.11.71  #因为配置单播,所以去掉多播的配置
  host = spmaster       #spmaster为主节点主机名
  port = 8649
  ttl = 1
}
udp_recv_channel {
  #mcast_join = 239.2.11.71   #单播要注掉mcast_join与bind
  port = 8649
  #bind = 239.2.11.71
  retry_bind = true
  # buffer = 10485760
}

2.2配置服务端gmetad.conf

data_source "unspecified" spmaster:8649    #unspecified要与gmond中配置的一致

其它客户端,只需把/etc/ganglia/gmond.conf配置文件scp到各个节点即可。

3.安装并配置spark

自行部署spark集群,编辑$SPARK_HOME/conf/metrics.properties文件(没有可以拷贝metrics.properties.template),添加以下内容:

*.sink.ganglia.class=org.apache.spark.metrics.sink.GangliaSink
*.sink.ganglia.host=spmaster
*.sink.ganglia.port=8649
*.sink.ganglia.period=10
*.sink.ganglia.unit=seconds
*.sink.ganglia.ttl=1
*.sink.ganglia.mode=unicast
*.sink.ganglia.name=unspecified

master.source.jvm.class=org.apache.spark.metrics.source.JvmSource
worker.source.jvm.class=org.apache.spark.metrics.source.JvmSource
driver.source.jvm.class=org.apache.spark.metrics.source.JvmSource
executor.source.jvm.class=org.apache.spark.metrics.source.JvmSource

更改后scp到其它spark节点,启动spark集群。

4.启动服务进行监控

启动ganglia的gmetad,gmond以及httpd服务:

service gmond start
service gmetad start
service httpd start

通过浏览器访问ganglia-web(http://spmaster/ganglia-web/)即可以看到spark相关的监控:

ganglia里面的图表实在太多了,需要些时间去熟悉、挖掘。

  

时间: 2024-10-05 20:04:41

Ganglia监控spark1.6.1的相关文章

ganglia监控自定义metric实践

Ganglia监控系统是UC Berkeley开源的一个项目,设计初衷就是要做好分布式集群的监控,监控层面包括资源层面和业务层面,资源层面包括cpu.memory.disk.IO.网络负载等,至于业务层面由于用户可以很方便的增加自定义的metric,因此可以用于做诸如服务性能.负载.出错率等的监控,例如某web服务的QPS.Http status错误率.此外,如果和Nagios集成起来还可以在某指标超过一定阈值时触发相应的报警. Ganglia相比zabbix的优势在于客户端收集agent(gm

Ubuntu 下配置Ganglia监控

Ganglia是比较知名的开源监控系统, 运维上需要关注的一些通用的状态都有所涉及.其组成主要是gmond(监控程序),gmetad(信息收集程序),web(监控数据展现app).ubuntu的apt源中Ganglia-webfrontend对应gmetad+web展现应用;ganglia-monitor对应gmond监控程序. 本文主要以ubuntu 14 server版为例进行安装配置: 监控主机: 192.168.1.1 被监控机: 192.168.1.2 ganglia在监控主机与被监控

Ganglia监控搭建

一.Ganglia介绍: Ganglia是一个监控服务器.集群的开源软件,能够用曲线图表现最近一个小时,最近一天,最近一周,最近一月,最近一年的服务器或者集群的cpu负载,内存,网络,硬盘等指标.Ganglia的强大在于:ganglia服务端能够通过一台客户端收集到同一个网段的所有客户端的数据,ganglia集群服务端能够通过一台服务端收集到它下属的所有客户端数据.这个体系设计表示一台服务器能够通过不同的分层能够管理上万台机器.这个功能是其他mrtg,nagios,cacti所不能比拟. 官方网

在OpenStack集群中安装Ganglia监控

1.Ganglia简介 Ganglia由gmond.gmetad和gweb三部分组成 gmond(Ganglia Monitoring Daemon)是一种轻量级服务,安装在每台需要收集指标数据的节点主机上.gmond在每台主机上完成实际意义上的指标数据收集工作,并通过侦听/通告协议和集群内其他节点共享数据.使用gmond,你可以很容易收集很多系统指标数据,如CPU.内存.磁盘.网络和活跃进程的数据等. gmetad(Ganglia Meta Daemon)是一种从其他gmetad或gmond源

ganglia监控

ganglia ganglia 是分布式的监控系统,有两个Daemon, 分别是:客户端Ganglia Monitoring Daemon (gmond)和服务端Ganglia Meta Daemon (gmetad),还有Ganglia PHP Web Frontend(基于web的动态访问方式)组成是一个Linux下图形化监控系统运行性能的软件,界面美观.丰富,功能强大 http://ganglia.sourceforge.net/ 软件下载 环境:RHEL6  x86-64 disable

Ganglia监控Hadoop集群的安装部署[转]

Ganglia监控Hadoop集群的安装部署 一. 安装环境 Ubuntu server 12.04 安装gmetad的机器:192.168.52.105 安装gmond的机 器:192.168.52.31,192.168.52.32,192.168.52.33,192.168.52.34,192.168.52.35,192.168.52.36,192.168.52.37,192.168.52.38,192.168.52.105 浏览监控web页面的机器:192.168.52.105 二. 介绍

Ganglia监控Hadoop集群的安装部署

Ganglia是UC Berkeley发起的一个开源实时监视项目,用于测量数以千计的节点,为云计算系统提供系统静态数据以及重要的性能度量数据.Ganglia系统基本包含以下三大部分. Gmond:Gmond运行在每台计算机上,它主要监控每台机器上收集和发送度量数据(如处理器速度.内存使用量等). Gmetad:Gmetad运行在Cluster的一台主机上,作为Web Server,或者用于与Web Server进行沟通. Ganglia Web前端:Web前端用于显示Ganglia的Metric

Ganglia 监控Hadoop

Ganglia监控Hadoop集群的安装部署 一. 安装环境 Ubuntu server 12.04 安装gmetad的机器:192.168.52.105 安装gmond的机 器:192.168.52.31,192.168.52.32,192.168.52.33,192.168.52.34,192.168.52.35,192.168.52.36,192.168.52.37,192.168.52.38,192.168.52.105 浏览监控web页面的机器:192.168.52.105 二. 介绍

Centos7.0 Ganglia监控 Yum 安装

简介: Ganglia由gmond.gmetad和gweb三部分组成. 1.服务器端(指的是汇总收集的监控数据机器):主要安装 gmetad  与 gweb :如果安装同时安装了 gmond ,服务        器端的这台机器监控数据也可以被收集. 2.客户端(指的是收集监控数据的机器):主要安装 gmond 即可. 3.显示端(指的就是一个web站点):主要安装 gweb. 实验环境: 1.centos 7.0 2.Ganglia 5.7 安装方式: 1.yum install  gangl