工作日记：Hadoop客户端配置需与集群节点保持一致

昨天因为datanode出现大规模离线的情况，初步判断是dfs.datanode.max.transfer.threads参数设置过小。于是将所有datanode节点的hdfs-site.xml配置文件都作了调整。重启集群后，为了验证，试着运行一个作业，在jobhistory中查看该作业的configuration，令人意外的是，显示的居然还是旧的值，也就是说，作业还是用旧的值运行的，明明所有datanode节点已经做了配置文件的更新了啊。

忽然间想起，hadoop作业的调度是由另外一台集群外的机器发起的，这台机的配置文件并没有更新。会不会是在作业发起的时候，读取的是这台客户端机器的hadoop配置呢？去更改这台客户机配置后再测试，新的作业果然使用了新配置的值了。

从这个事情上看，估计hadoop配置文件看来并不完全是由namenode、datanode等守护进程读取，有部分配置项其实是由发起作业的客户端读取，并传递到hadoop的job中并影响作业运行的。因此如果hadoop调度是由集群外机器发起，切记将发起机器的配置文件与集群配置文件保持一致，以避免各种莫名其妙的问题。

PS：以上结论只是根据实践进行的推测，后续要再根据资源查证确认。

时间： 2024-12-18 21:37:12

工作日记：Hadoop客户端配置需与集群节点保持一致的相关文章

基于Hadoop的数据分析综合管理平台之Hadoop、HBase完全分布式集群搭建

能够将热爱的技术应用于实际生活生产中,是做技术人员向往和乐之不疲的事. 现将前期手里面的一个项目做一个大致的总结,与大家一起分享.交流.进步.项目现在正在线上运行,项目名--基于Hadoop的数据分析综合管理平台. 项目流程整体比较清晰,爬取数据(txt文本)-->数据清洗-->文本模型训练-->文本分类-->热点话题发现-->报表"实时"展示,使用到的技术也是当今互联网公司常用的技术:Hadoop.Mahout.HBase.Spring Data Had

Hadoop 系列（二）—— 集群资源管理器 YARN

一.hadoop yarn 简介 Apache YARN (Yet Another Resource Negotiator) 是 hadoop 2.0 引入的集群资源管理系统.用户可以将各种服务框架部署在 YARN 上,由 YARN 进行统一地管理和资源分配. <div align="center"> <img width="600px" src="https://raw.githubusercontent.com/heibaiying/

菜鸟玩云计算之十八：Hadoop 2.5.0 HA 集群安装第1章

菜鸟玩云计算之十八:Hadoop 2.5.0 HA 集群安装第1章 cheungmine, 2014-10-25 0 引言在生产环境上安装Hadoop高可用集群一直是一个须要极度耐心和体力的仔细工作. 虽然有非常多文档教会大家怎么一步一步去完毕这样的工作,可是百密也有一疏. 现成的工具不是没有,可是对于我这个喜欢了解细节的人来说,用别人的东西,写的好还能够,写的不好,出了问题,查找错误难之又难.手工安装Hadoop集群须要对Linux有一定的使用经验.对于全然没有接触Linux的人来说.肯定是

zookeeper安装和配置(单机+伪集群+集群)

#单机模式解压到合适目录. 进入zookeeper目录下的conf子目录, 复制zoo_sample.cfg-->zoo.cfg(如果没有data和logs就新建):tickTime=2000 dataDir=/Users/apple/zookeeper/data dataLogDir=/Users/apple/zookeeper/logs clientPort=2180 参数说明:tickTime: zookeeper中使用的基本时间单位, 毫秒值.dataDir: 数据目录. 可以是任意目

18.1集群介绍 18.2 keepalived介绍18.3/18.4/18.5 用keepalived配置高可用集群

- 18.1 集群介绍 - 18.2 keepalived介绍 - 18.3/18.4/18.5 用keepalived配置高可用集群 - 扩展 - heartbeat和keepalived比较 http://blog.csdn.net/yunhua_lee/article/details/9788433 - DRBD工作原理和配置 http://502245466.blog.51cto.com/7559397/1298945 - mysql+keepalived http://lizhenl

集群介绍 keepalived介绍用keepalived配置高可用集群

一.集群介绍二.keepalived介绍VRRP协议是keepalived的一个核心,翻译为中文叫做:虚拟路由冗余协议keepalived是一个类似于layer3, 4 & 5交换机制的软件,也就是我们平时说的第3层.第4层和第5层交换.Keepalived是自动完成,不需人工干涉.简介Keepalived的作用是检测服务器的状态,如果有一台web服务器宕机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Ke

18.1 集群介绍；18.2 keepalived介绍；18.3,18.4,18.5 用keepalived配置高可用集群（上,中,下）；

18.1 集群介绍 1. 根据功能划分为两大类:高可用和负载均衡 2. 高可用集群通常为两台服务器,一台工作,另外一台作为冗余,当提供服务的机器宕机,冗余将接替继续提供服务 3. 实现高可用的开源软件有:heartbeat.keepalived 负载均衡集群,需要有一台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量至少为2 4. 实现负载均衡的开源软件有LVS.keepalived.haproxy.nginx,

集群介绍、keepalived介绍、用keepalived配置高可用集群

集群介绍 Linux集群根据功能划分为两大类:高可用和负载均衡. 1.高可用集群通常为2台服务器,一台工作,另一台作为冗余,当提供服务的机器宕机时,冗余将接替继续提供服务. 实现高可用的开源软件有:heartbeat.Keepalived,其中heartbeat很多bug已无人维护(不推荐使用),所以今后使用Keepalived来搭建高可用集群. 2.负载均衡集群,需要有1台服务器作为分发器,它负责把用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外就是给用户提供服务的服务器了,这些服

Linux集群（keepalived介绍，Keepalived配置高可用集群，Keepa+mysql

一.Linux集群概述根据功能划分为两大类:高可用和负载均衡 (1)高可用集群通常为两台服务器,台工作,另外一台作为准备,当提供服务的机器宕机,另外一台将接替继续提供服务. 实现高可用的开源软件有:heartbeat,keepalived (2)负载均衡集群:需要有一台服务器作为分发器,它负责吧用户的请求分发给后端的服务器处理,在这个集群里,除了分发器外,就是给用户提供服务的服务器了,这些服务器数量最少为2 实现负载均衡的开源软件有LVS,keepalived,haproxy,nginx,商业

猜你喜欢

防止多图OOM的核心解决思路就是使用LruCache技术

防止多图OOM的核心解决思路就是使用LruCache技术.但LruCache只是管理了内存中图片的存储与释放,如果图片从内存中被移除的话,那么又需要从网络上重新加载一次图片,这显然非常耗时.对此,Go ...

010.Windows环境下的安装gcc

Windows具有良好的界面和丰富的工具,所以目前linux开发的流程是,windows下完成编码工作,linux上实现编译工作. 为了提高工作效率,有必要在windows环境下搭建一套gcc,gdb ...

男童被公交碾压身亡违停者等20人遭索赔133万hh

一个和英国的司法系统.殖民地的经济利益完美结合的囚犯贸易体系,与其他形式的奴隶贸易一起,书写了美国这片自由之地的灰暗前传.在种族和阶级压迫的共同作用下,贫穷无业的白人和黑奴一样"合法地&qu ...

usb 驱动

usb 驱动学习总结: usb 采用分层的拓扑结构,金字塔型,最多是7层.usb 是主从结构,主和主或者从和从之间不能交换数据.理论上一个usb主控制器最多可接127个设备,协议规定每个usb设备具有 ...

无特征过狗一句话猥琐思路(代码执行)

来自:https://bypass.world/2017/01/%E6%97%A0%E7%89%B9%E5%BE%81%E8%BF%87%E7%8B%97%E4%B8%80%E5%8F%A5%E8%A ...

网页前端 html js 相关

1.注释 1.1HTML 注释 http://www.w3school.com.cn/html/html_comments.asp 注释标签  用于在 HTML 插入注 ...

JS表格组件神器bootstrap table详解（基础版）

这篇文章主要介绍了JS表格组件神器bootstrap table,bootstrap table界面采用扁平化的风格,用户体验比较好,更好兼容各种客户端,需要了解更多bootstrap table的朋 ...

C语言之结构体（2）

无意侵权:http://www.cnblogs.com/zhouxuanyu/p/4514754.html 再识C中的结构体在前面认识C中的结构体中我介绍了结构体的基础知识,下面通过这段代码来回顾一 ...

刳假卦殉纱乐词忱邓瓜戮白绽必孕

http://www.ebay.com/cln/5x7_531135/20150117/156305870019 http://www.ebay.com/cln/rpf_933337/20150117 ...

Source insight添加工具自动排版

当在网上找了一些别人的程序拿来学习,用Source insight来看时,会不会因为代码太乱看了义愤填膺呢? 有很多集成的开发环境可以自动排版,但source insight却不行!不过,有工具和配置 ...

MyBatis 实践 --配置

MyBatis 实践 Configuration mybatis-configuration.xml是MyBatis的全局配置文件(文件名任意),其配置内容和顺序如下: properties : 属性 ...

java-JVM内存模型及垃圾回收算法【一】

原文地址:http://blog.csdn.net/kingofworld/article/details/17718587 一.JVM内存模型总体架构图运行时数据区 JVM定义了不同运行时数据区, ...

有了函数名为什么还需要函数指针，函数指针有什么作用

声明一个函数可以用: 1. void function01(void); 2. void (*function02)(void); 第2个是用了函数指针,使用函数指针有两个好处: 1. 是可以动态设置 ...

转jmeter 性能测试 JDBC Request （查询数据库获取数据库数据）的使用

JDBC Request 这个Sampler可以向数据库发送一个jdbc请求(sql语句),并获取返回的数据库数据进行操作.它经常需要和JDBC Connection Configuration配置原 ...

WAN Optimizatoin - SaaS && Cloud

Part 1: SteelHead SaaS SteelHead SaaS uses Akamai's SRIP overlay network. Sure Route IP(SRIP) is an ...

Hibernate 优化技术之调用视图（View）和存储过程（Procedure）

前言上一篇blog记录了hibernate抓取策略的相关用法(http://blog.csdn.net/wlwlwlwl015/article/details/42705585),它主要是在对象导航 ...

LVS 之 DR model arp_announce arp_ignore转

DR模型之可伸缩Cache服务 DR核心:响应过程不经过Director DR模型要点: A.以下3种办法都能达到: 仅让Director 会响应 Router的关于VIP 的动态AR ...

解决Yum安装依赖问题

导读最近在网上看到很多关于安装网络Yum源是报错的求助,本小白也曾遇到过此类问题,后找过度娘没有有效的解决办法.最后,经过几番尝试后终于解决,现在将解决方案共享给大家! Yum源及安装安装过程在之 ...

在cmd模式下对mysql的操作语句

A.window下的语句 1.mysqld -install //安装mysql服务 2.mysqld -remove //卸载mysql服务 3.net start mysql //启动服务 ...

安装Tomcat插件到Eclipse

1.下载对应 eclipse 版本的 tomcat 插件版本 http://www.eclipsetotale.com/tomcatPlugin.html 2.解压tomcat插件,放入plugin ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.026 s.