格式化hdfs后，hadoop集群启动hdfs，namenode启动成功，datanode未启动

　　集群格式化hdfs后，在主节点运行启动hdfs后，发现namenode启动了，而datanode没有启动，在其他节点上jps后没有datanode进程！
原因：

　　当我们使用hdfs namenode -format格式化namenode时，会在namenode数据文件夹中保存一个current/VERSION文件，记录clusterID，而datanode中保存的current/VERSION文件中的clustreID的值是第一次格式化保存的clusterID，刚好有进行了一次格式化，在namenode的current/VERSION文件保存新的clusterID这样datanode和namenode之间的ID不一致。导致上述结果！

解决：

　　找current/VERSION文件路径。
　　namenode节点的路径是：/解压路径/hadoop-2.6.0/tmp/dfs/name/current/
　　datanode节点的路径是：/解压路径/hadoop-2.6.0/tmp/dfs/data/current/
　　找到VERSION后打开查看，一对比，datanode的clustreID与其他3台datanode的clustreID真的不同！
　　将datanode的clustreID的值改成与datanode的clustreID相同后再启动，成功！　　

原文地址：https://www.cnblogs.com/Liuyt-61/p/10360049.html

时间： 2024-11-08 05:40:59

格式化hdfs后，hadoop集群启动hdfs，namenode启动成功，datanode未启动的相关文章

为已存在的Hadoop集群配置HDFS Federation

一.实验目的 1. 现有Hadoop集群只有一个NameNode,现在要增加一个NameNode. 2. 两个NameNode构成HDFS Federation. 3. 不重启现有集群,不影响数据访问. 二.实验环境 4台CentOS release 6.4虚拟机,IP地址为 192.168.56.101 master 192.168.56.102 slave1 192.168.56.103 slave2 192.168.56.104 kettle 其中kettle是新增的一台"干净"

hadoop集群之HDFS和YARN启动和停止命令

假如我们只有3台linux虚拟机,主机名分别为hadoop01.hadoop02和hadoop03,在这3台机器上,hadoop集群的部署情况如下: hadoop01:1个namenode,1个datanode,1个journalnode,1个zkfc,1个resourcemanager,1个nodemanager: hadoop02:1个namenode,1个datanode,1个journalnode,1个zkfc,1个resourcemanager,1个nodemanager: hadoo

Hadoop集群(二) HDFS搭建

HDFS只是Hadoop最基本的一个服务,很多其他服务,都是基于HDFS展开的.所以部署一个HDFS集群,是很核心的一个动作,也是大数据平台的开始. 安装Hadoop集群,首先需要有Zookeeper才可以完成安装.如果没有Zookeeper,请先部署一套Zookeeper.另外,JDK以及物理主机的一些设置等.请参考: Hadoop集群(一) Zookeeper搭建 Hadoop集群(三) Hbase搭建 Hadoop集群(四) Hadoop升级下面开始HDFS的安装 HDFS主机分配 1

Apache Hadoop集群安装（NameNode HA + SPARK + 机架感知）

1.主机规划序号主机名 IP地址角色 1 nn-1 192.168.9.21 NameNode.mr-jobhistory.zookeeper.JournalNode 2 nn-2 192.168.9.22 Secondary NameNode.JournalNode 3 dn-1 192.168.9.23 DataNode.JournalNode.zookeeper.ResourceManager.NodeManager 4 dn-2 192.168.9.24 DataNode.zook

Hadoop集群（第8期）_HDFS初探之旅

1.HDFS简介 HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础,是基于流数据模式访问和处理超大文件的需求而开发的,可以运行于廉价的商用服务器上.它所具有的高容错.高可靠性.高可扩展性.高获得性.高吞吐率等特征为海量数据提供了不怕故障的存储,为超大数据集(Large Data Set)的应用处理带来了很多便利. Hadoop整合了众多文件系统,在其中有一个综合性的文件系统抽象,它提供了文件系统实现的各类接口

Hadoop集群管理

1.简介 Hadoop是大数据通用处理平台,提供了分布式文件存储以及分布式离线并行计算,由于Hadoop的高拓展性,在使用Hadoop时通常以集群的方式运行,集群中的节点可达上千个,能够处理PB级的数据. Hadoop各个模块剖析:https://×××w.cnblogs.com/funyoung/p/9889719.html 2.Hadoop集群架构图 3.Hadoop集群搭建 3.1 修改配置 1.配置SSH以及hosts文件由于在启动hdfs.yarn时都需要对用户的身份进行验证,且集群

基于OGG的Oracle与Hadoop集群准实时同步介绍

Oracle里存储的结构化数据导出到Hadoop体系做离线计算是一种常见数据处置手段.近期有场景需要做Oracle到Hadoop体系的实时导入,这里以此案例做以介绍.Oracle作为商业化的数据库解决方案,自发性的获取数据库事务日志等比较困难,故选择官方提供的同步工具OGG(Oracle GoldenGate)来解决. 安装与基本配置环境说明软件配置角色数据存储服务及版本 OGG版本 IP 源服务器 OracleRelease11.2.0.1 Oracle GoldenGate 11.2

Hadoop集群性能优化一

挺喜欢这句话:"坚持,是基于你对某件事的热爱,才能有动力坚持下去. 在学习的过程中,需要战胜自己的惰性和骄傲!"好了,下面说下如何提升集群的性能: 在硬件方面,第一,商业硬件并不等同于低端硬件.低端机器常常使用便宜的零部件,其故障率远高于更昂贵的机器.当用户管理几十台.上百台甚至几千台机器时,便宜的零部件故障率更高,导致维护成本更高:第二, 不推荐使用大型数据库级别的机器,因为性价比太低了. 在相同硬件的情况下,一个配置好的的集群要比配置糟糕的集群在性能上快数倍乃至数十倍.

使用Azure Blob优化Hadoop集群存储成本

大数据与云计算的关系就像一枚硬币的正反面一样密不可分,大数据是云计算非常重要的应用场景,而云计算则为大数据的处理和数据挖掘都提供了最佳的技术解决方案.云计算的快速供给.弹性扩展以及按用量付费的优势已经给IT行业带来了巨大变化,它已经日益成为企业IT的首选.在让企业通过数据洞察提升效率和效益的同时,如何降低大数据平台成本也是IT部门经常关心的问题. 为什么用Azure Blob作为Hadoop分布式文件系统管理大数据? HDFS是Hadoop集群分布式文件系统,它将文件分割为数据块Block,默认

Hadoop集群（第7期）_Eclipse开发环境设置

1.Hadoop开发环境简介 1.1 Hadoop集群简介 Java版本:jdk-6u31-linux-i586.bin Linux系统:CentOS6.0 Hadoop版本:hadoop-1.0.0.tar.gz 1.2 Windows开发简介 Java版本:jdk-6u31-windows-i586.exe Win系统:Windows 7 旗舰版 Eclipse软件:eclipse-jee-indigo-SR1-win32.zip | eclipse-jee-helios-SR2-win32

猜你喜欢

python第十二天

第二模块学习: 生成器,迭代器,内置函数生成器特点:只有在调用时才会生成相应的数据,运行的速度快! 示例: 1 def fil(max):#斐波那契数 2 n,a,b=0,0,1 #定义初始数据 ...

使用secureCRT上传下载

secureCRT 的下载 http://pan.baidu.com/s/1c1Mz1ks 下载完成后,输入yum install lrzsz,安装这个东西, 然后就可以直接在secureCRT中输 ...

富文本中的段落属性

// NSParagraphStyleAttributeName 段落的风格(设置首行,行间距,对齐方式什么的)看自己需要什么属性,写什么 NSMutableParagraphStyle *parag ...

无缝滚动封装代码

<script> function wfgd(a,b,c,d){ var a=document.getElementById(a); var b=document.getElementBy ...

linux学习笔记--vim程序编辑器

1,在linux系统中使用文本编辑器来编辑自己的linux参数配置文件是一件很重要的事情,因此系统管理员至少应该要熟悉一种文本编辑器. 2,不同的linux distribution各有不同的附加软件 ...

Python3中级玩家：淘宝天猫商品搜索爬虫自动化工具（第一篇）

Python3中级玩家:淘宝天猫商品搜索爬虫自动化工具(第一篇) 一.前言大家好,今天我要来讲讲一个比较实用的爬虫工具,抓取淘宝的关键字商品信息,即是: 输入关键字,按照价格等排序,抓取列出的商品信 ...

wamp安装

下载之后双击文件进行安装选择:I accept the agreement ,点击Next. 一直单击NEXT 安装完成后运行wamp,在桌面右下角即会出现wamp的图标,图标最初是红色的,然后变为橙 ...

利用html5的画布实现图片的自由裁剪

先看效果操作方法: 1.图片地址,粘入input框中. 2.点击抓取,此后便可在图片中用鼠标划出目标区域. 3.点击裁剪便可裁剪出目标区域. 4.点击保存,即可将裁剪的图片上传到服务器. 附件下载: ...

JavaScript第五章

引用类型引用类型是一种将数据和功能组织在一起的数据结构. 引用类型:描述的是一类对象所具有的属性和方法: 对象是某个特定引用类型的实例. 1.Object类型创建Object实例的方法有两种: ( ...

【BZOJ1093】【ZJOI2007】最大半联通子图 [拓扑][DP][Tarjan]

最大半连通子图 Time Limit: 30 Sec Memory Limit: 162 MB[Submit][Status][Discuss] Description 一个有向图G=(V,E)称为 ...

Heap Data Structure and Heap Sort

参考:http://www.codeproject.com/Tips/732196/Heap-Data-Structure-and-Heap-Sort#xx4775794xx #include < ...

python学习之面向对象学习

一.什么事面向对象,以及面向对象的优点? 面向过程优缺点: 我们知道面向过程是流水线式的编程,过程就是解决问题的步骤,把大的问题化解成小的模块面向过程优点: 极大的降低了程序的复杂度面向过程缺点: ...

贪心算法讲解及例题

修改自:http://blog.csdn.net/a925907195/article/details/41314549 一.概念: 贪心算法是指,在对问题求解时,总是做出在当前看来是最好的选择.也就 ...

sshfs命令挂载远程目录(debian centos)

项目有台online机器需要迁移到另外1台上去上面有多个不同目录需要 scp到另外1台上去发现使用sshfs一次性的将目录挂载过来在本地复制后在umount 这样省事也方便,也省去每次scp需要 ...

wsdl文档分析

<?xml version="1.0" encoding="UTF-8"?> <definitions xmlns:wsu="htt ...

Window 10系统下创建无线热点

Navicate快捷键

1.ctrl+q 打开查询窗口 2.ctrl+/ 注释sql语句 3.ctrl+shift +/ 解除注释 4.ctrl+r 运行查询窗口的sql语句 5.ctrl+shift+r 只运行选中的sql ...

关于色相\饱和度

说白了就是控制你要调整的范围,选范围,加范围,减范围. 不过这个范围的变化参照是色相,所以你才会觉得高深,其实还是简单.

Python入门学习笔记（二）

今天学习了一些简单的语法规则,话不多说,开始了: 二.数据类型常用数据类型中的整形和浮点型就不多说了. 1.字符串字符串是用 ‘’ 或者“” 括起来的任意文本,比如’dfjksj’,”tijdkf ...

转载自——Json.net动态序列化以及对时间格式的处理

关于我工作中对Json处理的东西第一:动态序列化类第二:时间格式处理通常我们一个类里可能有十到更多的属性,但是我们序列化通常只需要序列化其中的三到五个这样的话就会有多余的数据如果我只想序 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.028 s.