CDH秘籍(两):cloudera Manager存储监控数据

概述

上一篇文章分析了cloudera manager中监控数据、中心数据的存储方式,如何配置外部表等。这一篇文章进一步分析监控数据的存储,配置,调优等。

Service Monitor 和 Host Monitor 角色在cloudera
manager中存储了时间序列、健康数据、Impla查询和Yarn应用的元数据。经过查看对应的Cloudera Manager的存储连接,发现Service
Monitor和Host Monitor的存储使用的是levelDB的解析类,由此能够判断出本地存储使用的是levelDB。LevelDB能够说是key-value的数据库的鼻祖。读写效率特别高,并发也非常大。而Cloudera
Manager的监控的读写数据特别多、频繁。这也可能是Cloudera Manager5选择使用levelDB替换关系数据库的原因。

监控数据在Cloudera Manager升级中的迁移

Cloudera Manager 5 存储Host Monitor 和 Service
Monitor数据到本地数据库。假设使用自己主动化升级配置从Cloudera Manager 4 升级到 5。数据会从Cloudera manager 4 中的内嵌数据库或者外部数据库中自己主动迁移到Cloudera
Manger5中的本地数据库中。

这是一个自己主动化运行的过程中,中间能够查看迁移过程的日志等。

Service Monitor 数据存储的配置

Service Monitor存储了时间序列和健康数据。Impla查询的元数据,Yarn应用的元数据。默认情况下,数据时存储在/var/lib/cloudera-service-monitor/文件夹下,你也能够改动Service
Monitor Storage Directory 配置firehose.storage.base.directory。

You can control how much disk space to reserve for the different classes of data the Service Monitor stores by changing the following
configuration options:

Time-series metrics and health data - Time-Series Storage (firehose_time_series_storage_bytes - 10 GB default)

Impala query metadata - Impala Storage (firehose_impala_storage_bytes - 1 GB default)

YARN application metadata - YARN Storage (firehose_yarn_storage_bytes - 1 GB default)

Host Monitor 数据存储的配置

Host Monitor存储了时间序列和健康数据。默认情况下,数据存储在/var/lib/cloudera-host-monitor/文件夹下。你也能够改动Host
Monitor Storage Directory 配置。

You can control how much disk space to reserve for Host Monitor data by changing the following configuration option:

Time-series metrics and health data: Time Series Storage (firehose_time_series_storage_bytes - 10 GB default)

数据粒度和时间序列指标数据

Service Monitor 和 Host Monitor使用非常多方式存储时间序列指标数据。数据会不断的被汇总成不同的粒度。比方每个小时,会把数据的平均值,最小值。最大值汇总成一个小时为粒度的数据,每6个小时。会汇总成6个小时的数据。每天、每个星期等。这样的方式仅仅会汇总指标数据。Impla的查询和Yarn应用的监控数据当接近限制时,会删除旧的数据。

当存储快达到限制时。会先删除粒度最细的数据。保证存储空间的释放。比方会先删除小时为粒度的数据,其次是以天微粒度的数据。

Moving
Monitoring Data on an Active Cluster

Host
Monitor and Service Monitor Memory Configuration

原创文章,欢迎转载。转载请标明出处  http://blog.csdn.net/shifenglov/article/details/41281399

版权声明:本文博客原创文章,博客,未经同意,不得转载。

时间: 2024-08-30 11:04:05

CDH秘籍(两):cloudera Manager存储监控数据的相关文章

CDH使用秘籍(二):cloudera Manager中监控数据的存储

概述 上一篇文章分析了cloudera manager中监控数据.中心数据的存储方式,怎样配置外部表等.这一篇文章进一步分析监控数据的存储,配置,调优等. Service Monitor 和 Host Monitor 角色在cloudera manager中存储了时间序列.健康数据.Impla查询和Yarn应用的元数据.经过查看相应的Cloudera Manager的存储连接,发现Service Monitor和Host Monitor的存储使用的是levelDB的解析类,由此可以推断出本地存储

CDH 2、Cloudera Manager的安装

1.Cloudera Manager • Cloudera Manager是一个管理CDH的端到端的应用. • 作用: – 管理 – 监控 – 诊断 – 集成 • 架构 • Server – 管理控制台服务器和应用程序逻辑 – 负责软件安装.配置,启动和停止服务 – 管理服务运行的群集 • Agent – 安装在每台主机上 – 负责启动和停止进程,配置,监控主机 • Management Service – 由一组角色组成的服务,执行各种监视.报警和报告功能 • Database • Cloud

小记--------CDH版本启动cloudera manager UI界面

首先需要启动mysql源数据库 server所在服务器的路径:/opt/cm-5.14.0/etc/cloudera-scm-server 下 查看配置文件: db.properties   查看mysql源数据库配置在哪台服务器,然后去对应服务器启动mysql元数据  service mysqld start 然后去每台服务器下的路径:/opt/cm-5.14.0/etc/init.d 启动agent : ./cloudera-scm-agent start (每台都需要启动) 启动serve

Cloudera Manager和CDH版本的对应关系

来源:https://www.cloudera.com/documentation/enterprise/release-notes/topics/rn_consolidated_pcm.html#cm_cdh_compatibility Cloudera uses the following versioning convention: major.minor.maintenance. If a cluster runs Cloudera Manager 5.14.0, the major v

卸载 Cloudera Manager 5.1.x.和 相关软件【官网翻译】

问题导读: 1.不同的安装方式,卸载方法存在什么区别?2.不同的操作系统,卸载 Cloudera Manager Server and 数据库有什么区别? 重新安装不完整如果你来到这里,因为你的安装没有完成(例如,如果它是由一个虚拟机超时中断),和你想继续安装,然后重新安装,做到以下几点:删除文件和目录: 个人建议:这一步虽然是官网这么做,但是下面命令还是不要执行,因为我们后面还会用到下面命令 /usr/share/cmf/uninstall-cloudera-manager.sh 复制代码 当

如何从Zabbix数据库中获取监控数据

做过Zabbix的同学都知道,Zabbix通过专用的Agent或者SNMP收集相关的监控数据,然后存储到数据库里面实时在前台展示.Zabbix监控数据主要分为以下两类: 历史数据:history相关表,从history_uint表里面可以查询到设备监控项目的最大,最小和平均值,即存储监控数据的原始数据. 趋势数据:trends相关表,趋势数据是经过Zabbix计算的数据,数据是从history_uint里面汇总的,从trends_uint可以查看到监控数据每小时最大,最小和平均值流量. Zabb

全网最全Centos7 Cloudera Manager 安装与使用

全网最全Centos7 安装与使用 Cloudera Manager  一.准备工作 1.修改hostname 2.关闭selinux 3.关闭防火墙 4.配置hosts 5.安装JDK 6.配置环境变量 二.安装Cloudera Manager  1.从官网下载CDH软件包和Cloudera Manager 安装包 2.安装相关依赖组件 3.启动Httpd服务 4.配置NTP时钟同步 5.安装MySQL 6.Cloudera Manager Server的安装 7.Cloudera Manag

CDH使用秘籍(一):Cloudera Manager和Managed Service的数据库

背景 从业务发展需求,大数据平台须要使用spark作为机器学习.数据挖掘.实时计算等工作,所以决定使用Cloudera Manager5.2.0版本号和CDH5. 曾经搭建过Cloudera Manager4.8.2和CDH4,在搭建Cloudera Manager5.2.0版本号的时候,发现对应的Service Host Monitor 和 Service Monitor不能配置外部表,刚开是还以为是配置出错,后来才发现应该是新版本号的Cloudera的存储改变方式了.查了非常多文档,果然发现

CentOS 7下Cloudera Manager及CDH 6.0.1安装过程详解

一.概念介绍 1.CDH 概览 CDH是Apache Hadoop和相关项目的最完整.最受测试和最流行的发行版.CDH提供Hadoop的核心元素-可伸缩存储和分布式计算-以及基于web的用户界面和重要的企业功能.CDH是Apache许可的开放源码,是唯一提供统一批处理.交互式SQL和交互式搜索以及基于角色的访问控制的Hadoop解决方案. CDH 提供以下特性: 灵活性:存储任何类型的数据并使用各种不同的计算框架进行操作,包括批处理.交互式SQL.免费文本搜索.机器学习和统计计算. 集成:在一个