CDH平台规划注意事项

1. 业务数据全部存储在datanode上面,所以datanode的存储空间必须足够大,且每个datanode的存储空间尽量保持一致。

2. 管理节点/namenode对存储空间要求不高,主要存储各计算节点datanode的元数据信息,以3个datanode为例,每个datanode存储2T的数据,namenode才耗费80G的空间。

3. 由于Hadoop有数据副本机制,默认为3个副本,因此datanode节点,系统盘做raid 1,数据盘做raid 0;namenode做raid 5,不管系统盘还是数据盘,都可以直接更换,保证数据不丢失;

4. 计算节点datanode依靠的是数量优势,除了存储空间足够大之外,对机器配置要求不高,但是安装Spark和impala的话对内存的要求较高,单节点2T的数据配置64G的单机内存有点吃力。

5. 但是namenode要跟所有的datanode交互,接收处理各种请求,对机器配置要求较高,以的测试数据来看,namenode存放80G的元数据时,64G的内存已经有点紧张了,开始使用交换内存了。

6. namenode和Secondary namenode需要各自独立的两个节点,即相互独立部署,这样即使namenode机器挂了,也可以手动从secondary namenode恢复一下。在hadoop 2高可靠性下可以配置两个namenode,

保证一个namenode出现问题可以自动切换至另一个。

7. 由于secondary namenode的是周期性的合并日志文件,因此单独部署时对机器压力较小,空间使用也只勉强是namenode的一半,因此可以把诸如Hive/Hbase等的服务器端安装在snn所在的服务器上,

这样可以使机器资源得到最大化利用。

8. hdfs空间不够开始报警,但是df –h命令下查看就会发现其实空间余额还有好几T,这种情况是由于non dfs used空间膨胀导致的,non dfs used和remaining一起构成了hdfs的可用空间容量,

两者呈现此消彼长的关系。Non dfs used从字面理解来看是非Hadoop文件占用的空间,实际上是某些文件删除之后,hadoop的组件没有释放对其引用导致的,从的情况来看,单个节点2T的

数据运行一个月会产生600G的non dfs used空间,最笨的办法就是重启CDH,一下子占用就到1G以下了。

原文地址:https://www.cnblogs.com/weiyiming007/p/12584976.html

时间: 2024-10-13 20:33:46

CDH平台规划注意事项的相关文章

平台使用注意事项

一.在定义消息类型时,从平台上保存消息类型实际上是把消息类型的配置信息配置到xml文件中,xml文件的保存地址为apphome目录下,但是要想能在web中成功运行并且找到定义的消息类型必须把对应的xml文件复制到tomcat的对应发布目录下才能成功加载 二.发送端口,接收端口的配置信息产生的xml文件也应该保存到tomcat对应的发布目录下 三.适配器的配置不能从平台中的组件配置中直接添加,适配器类不是配置完成后存储在xml文件中的.而是事先配置在扩展点文件中,在平台启动时调换eunmAdapt

互联网分布式微服务云平台规划分析--平台整体规划

导语 近期公司孵化了一个互联网产品,随着业务发展,产品运营后用户数据量(过亿).业务数据量(过100亿)较大,技术团队配合产品.运营快速定制化开发, 还要考虑产品涉及的资金安全.消息的及时性.业务的制动化处理,我们选择鸿鹄cloud分布式云架构平台作为公司产品核心企业架构. 产品平台规划 微服务注册中心(分布式集群部署).微服务配置中心(分布式集群部署).服务网关平台(分布式集群部署). 微服务监控平台.SSO单点登录平台(分布式集群部署).微服务相关组件(分布式集群部署).后台管理平台. 定时

(一)spring cloud互联网分布式微服务云平台规划分析--spring cloud平台整体规

导语 近期公司孵化了一个互联网产品,随着业务发展,产品运营后用户数据量(过亿).业务数据量(过100亿)较大,技术团队配合产品.运营快速定制化开发, 还要考虑产品涉及的资金安全.消息的及时性.业务的制动化处理,我们选择鸿鹄cloud分布式云架构平台作为公司产品核心企业架构. 产品平台规划 微服务注册中心(分布式集群部署).微服务配置中心(分布式集群部署).服务网关平台(分布式集群部署). 微服务监控平台.SSO单点登录平台(分布式集群部署).微服务相关组件(分布式集群部署).后台管理平台. 定时

(二)Java版Spring Cloud B2B2C o2o鸿鹄云商平台--b2b2c平台规划

由于公司要做整套电子商务解决方案,考虑到平台的通用性(其中b2b.b2c.o2o.小程序,都离不开基础平台),优先给公司规划: 平台管理端(统一管理,包含自营店铺).商家管理端(可以入驻,多租户模式).买家端(支持PC.h5/公众号.小程序.ios/android)三个通用平台. 有spring cloud b2b2c电子商务需求的朋友可以加企鹅求求:三五三六二四七二五九 平台管理端,因为考虑到平台管理的用户访问量比较小,而且都是一些针对于数据表单的操作,如:清单列表.分页.添加.修改.删除.导

互联网分布式微服务云平台规划分析--服务监控中心

1.介绍 鸿鹄云架构[服务监控中心]提供简洁的可视化WEB UI,来管理 Spring Cloud 微服务应用程序. 2.平台基础功能 服务在线状态监控.Logging日志级别管理.JMX beans管理.Threads会话和线程管理.Trace应用请求跟踪 应用运行参数信息 Java 系统属性.Java 环境变量属性.内存信息.Spring 环境属性 Spring Cloud其他组件监控 如:当前处于活跃状态的会话数量.当前应用的并发数.延迟以及其他度量信息.可以根据业务需要进行定制3.运行环

互联网分布式微服务云平台规划分析--SSO单点登录系统

介绍 鸿鹄云架构[SSO单点登录系统]为所有微服务提供统一的用户认证服务,系统本身属于微服务模式,使用JWT+Redis分布式存储方案,确保不同微服务.系统之间的安全通讯和统一用户校验.认证.在整个服务平台中起着用户枢纽中心的作用. 平台基础功能 用户注册&登录.用户登录&校验(APP).用户登录&校验(PC).用户登出.用户密码修改.用户密码重置运行环境支持 开发工具:Eclipse.MyEclipse.Idea WEB容器:内置Tomcat JDK版本:1.8+ 系统支持:Wi

spring cloud互联网分布式微服务云平台规划分析--spring cloud服务统一配置中心

1.介绍鸿鹄云架构[服务统一配置中心]为分布式系统中的外部配置提供服务器和客户端支持.使用commonservice-config,可以在所有环境中管理应用程序的外部属性.应用程序可通过从开发人员到测试和生产的部署流程,可以管理这些环境之间的配置,并确定应用程序具有迁移时需要运行的一切.服务器存储后端的默认实现使用git,因此它轻松支持标签版本的配置环境,以及可以访问用于管理内容的各种工具.很容易添加替代实现,并使用Spring Cloud Bus配置刷新方案.更多资源欢迎球911708498

spring cloud互联网分布式微服务云平台规划分析--spring cloud服务监控中心

1.介绍 鸿鹄云架构[服务监控中心]提供简洁的可视化WEB UI,来管理 Spring Cloud 微服务应用程序. 2.平台基础功能 服务在线状态监控.Logging日志级别管理.JMX beans管理.Threads会话和线程管理.Trace应用请求跟踪 应用运行参数信息?更多资源欢迎球911708498 Java 系统属性.Java 环境变量属性.内存信息.Spring 环境属性 Spring Cloud其他组件监控 如:当前处于活跃状态的会话数量.当前应用的并发数.延迟以及其他度量信息.

spring cloud互联网分布式微服务云平台规划分析--spring cloud定时调度平台

1.介绍 鸿鹄云架构[定时调度平台]是一个完全由Java编写的开源任务调度框架,为企业在任务调度提供了简单却强大的机制.开发人员根据业务规则,使用调度平台简单配置,就可以让任务在特定时间特定阶段进行运行.特点如下: 1.强大的调度功能,例如支持丰富多样的调度方法,可以满足各种常规及特殊需求. 2.灵活的应用方式,例如支持任务和调度的多种组合方式,支持调度数据的多种存储方式. 3.分布式和集群能力,在复杂业务调度下非常稳定. 2.平台基础功能 调度管理 调度列表.新增任务.修改任务.删除任务.暂停