HDFS概述---namenode的设计详解

HDFS的设计概述：

NameNode的设计

维护名字空间，是HDFS中文件目录和文件分配的管理者。保存的重要信息如下：

文件名 ————> 数据块，NameNode在其本地磁盘上保存为文件（持久化）

对目录树和文件名的更新——>数据块，使用操作日志来保存更新。

数据块 ————> DataNode列表，NameNode不存，通过DataNode上报建立起来。

一个HDFS集群上可能包含成千个DataNode节点，这些DataNode定时和NameNode通信，接受NameNode的指令。为了减轻NameNode的负担，NameNode上并不永久保存那个DataNode上有那些数据块的信息，而是通过DataNode启动时的上报，来更新NameNode上的映射表。

DataNode和NameNode建立连接以后，就会不断地和NameNode保持心跳。心跳的返回其还也包含了NameNode对DataNode的一些命令，如删除数据库或者是把数据块复制到另一个DataNode。应该注意的是：NameNode不会发起到DataNode的请求，在这个通信过程中，它们是严格的服务器/客户端架构。

DataNode当然也作为服务器接受来自客户端的访问，处理数据块读/写请求。DataNode之间还会相互通信，执行数据块复制任务，同时，在客户端做写操作的时候，DataNode需要相互配合，保证写操作的一致性。

下面我们就来具体分析一下DataNode的实现。DataNode的实现包括两部分，一部分是对本地数据块的管理，另一部分，就是和其他的实体打交道。我们先来看本地数据块管理部分。

安装Hadoop的时候，我们会指定对应的数据块存放目录，当我们检查数据块存放目录目录时，我们回发现下面有个叫dfs的目录，所有的数据就存放在dfs/data里面。

其中有两个文件，storage里存的东西是一些出错信息，貌似是版本不对?云云。in_use.lock是一个空文件，它的作用是如果需要对整个系统做排斥操作，应用应该获取它上面的一个锁。

接下来是3个目录，current存的是当前有效的数据块，detach存的是快照（snapshot，目前没有实现），tmp保存的是一些操作需要的临时数据块。但我们进入current目录以后，就会发现有一系列的数据块文件和数据块元数据文件。同时还有一些子目录，它们的名字是subdir0到subdir63，子目录下也有数据块文件和数据块元数据。这是因为HDFS限定了每个目录存放数据块文件的数量，多了以后会创建子目录来保存。

数据块文件显然保存了HDFS中的数据，数据块最大可以到64M。每个数据块文件都会有对应的数据块元数据文件。里面存放的是数据块的校验信息。下面是数据块文件名和它的元数据文件名的例子： blk_3148782637964391313

blk_3148782637964391313_242812.meta

上面的例子中，3148782637964391313是数据块的ID号，242812是数据块的版本号，用于一致性检查。在current目录下还有下面几个文件：

VERSION，保存了一些文件系统的元信息。

dncp_block_verification.log.curr和dncp_block_verification.log.prev，它记录了一些DataNode对文件系定时统做一致性检查需要的信息。

更多分享请关注：bbs.superwu.cn 超人学院微信：BJ-CRXY

时间： 2024-11-13 07:14:58

HDFS概述---namenode的设计详解的相关文章

HDFS体系结构(NameNode、DataNode详解)

hadoop项目地址:http://hadoop.apache.org/ 分布式文件系统概述: 数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统 . 是一种允许文件通过网络在多台主机上分享的文件系统,可让多机器上的多用户分享文件和存储空间. 通透性.让实际上是通过网络来访问文件的动作,由程序与用户看来,就像是访问本地的磁盘一般. 容错.即使系统中有某些节点脱机,整体

Java开源生鲜电商平台-Java后端生成Token架构与设计详解(源码可下载）

Java开源生鲜电商平台-Java后端生成Token架构与设计详解(源码可下载) 目的:Java开源生鲜电商平台-Java后端生成Token目的是为了用于校验客户端,防止重复提交. 技术选型:用开源的JWT架构. 1.概述:在web项目中,服务端和前端经常需要交互数据,有的时候由于网络相应慢,客户端在提交某些敏感数据(比如按照正常的业务逻辑,此份数据只能保存一份)时,如果前端多次点击提交按钮会导致提交多份数据,这种情况我们是要防止发生的. 2.解决方法: ①前端处理:在提交之后通过js立即将按钮

搞懂分布式技术4：ZAB协议概述与选主流程详解

搞懂分布式技术4:ZAB协议概述与选主流程详解 ZAB协议 ZAB(Zookeeper Atomic Broadcast)协议是专门为zookeeper实现分布式协调功能而设计.zookeeper主要是根据ZAB协议是实现分布式系统数据一致性. zookeeper根据ZAB协议建立了主备模型完成zookeeper集群中数据的同步.这里所说的主备系统架构模型是指,在zookeeper集群中,只有一台leader负责处理外部客户端的事物请求(或写操作),然后leader服务器将客户端的写操作数据同步

PXE的概述及Linux使用详解

PXE的概述及使用详解现在企业采购的很多计算机都是没光驱的,怎么安装系统呢?另外,如何能快速大规模安装Linux服务器操作系统呢,有什么好办法吗? 答案是有的,那就是本文要说的:PXE PXE(preboot execute environment,预启动执行环境)是由Intel公司开发的最新技术,工作于Client/Server的网络模式,支持工作站通过网络从远端服务器下载映像,并由此支持通过网络启动操作系统,在启动过程中,终端要求服务器分配IP地址,再用TFTP(trivial filet

HDFS常用的Java Api详解

转自:http://blog.csdn.net/michaelwubo/article/details/50879832 一.使用Hadoop URL读取数据 package hadoop; import java.io.InputStream; import java.net.URL; import org.apache.hadoop.fs.FsUrlStreamHandlerFactory; import org.apache.hadoop.io.IOUtils; public class

Namenode HA原理详解

社区hadoop2.2.0 release版本开始支持NameNode的HA,本文将详细描述NameNode HA内部的设计与实现. 原文见 http://xiguada.org/namenode-ha-principle/ 为什么要Namenode HA? 1.NameNode High Availability即高可用. 2.NameNode 很重要,挂掉会导致存储停止服务,无法进行数据的读写,基于此NameNode的计算(MR,Hive等)也无法完成. Namenode HA 如何实现,关

Dubbo架构设计详解【转】

Dubbo是Alibaba开源的分布式服务框架,它最大的特点是按照分层的方式来架构,使用这种方式可以使各个层之间解耦合(或者最大限度地松耦合).从服务模型的角度来看,Dubbo采用的是一种非常简单的模型,要么是提供方提供服务,要么是消费方消费服务,所以基于这一点可以抽象出服务提供方(Provider)和服务消费方(Consumer)两个角色.关于注册中心.协议支持.服务监控等内容,详见后面描述. 总体架构 Dubbo的总体架构,如图所示:Dubbo框架设计一共划分了10个层,而最上面的Servi

Dubbo架构设计详解

Dubbo是Alibaba开源的分布式服务框架,它最大的特点是按照分层的方式来架构,使用这种方式可以使各个层之间解耦合(或者最大限度地松耦合).从服务模型的角度来看,Dubbo采用的是一种非常简单的模型,要么是提供方提供服务,要么是消费方消费服务,所以基于这一点可以抽象出服务提供方(Provider)和服务消费方(Consumer)两个角色.关于注册中心.协议支持.服务监控等内容,详见后面描述. 总体架构 Dubbo的总体架构,如图所示:Dubbo框架设计一共划分了10个层,而最上面的Servi

Dubbo架构设计详解（转收藏）

转自:http://shiyanjun.cn/archives/325.html Dubbo是Alibaba开源的分布式服务框架,它最大的特点是按照分层的方式来架构,使用这种方式可以使各个层之间解耦合(或者最大限度地松耦合).从服务模型的角度来看,Dubbo采用的是一种非常简单的模型,要么是提供方提供服务,要么是消费方消费服务,所以基于这一点可以抽象出服务提供方(Provider)和服务消费方(Consumer)两个角色.关于注册中心.协议支持.服务监控等内容,详见后面描述. 总体架构 Du

猜你喜欢

virt-manager 解决kvm 不能键盘输入的问题

virt-manager 解决kvm 不能键盘输入的问题

IOS--UILabel的使用方法详细

IOS--UILabel的使用方法详细 //UILabel的使用 UILabel *oneLabel = [[UILabel alloc] init]; // 最经常使用的 oneLabel.fram ...

可视化工具gephi源码探秘(二)---导入netbeans

在上篇<可视化工具gephi源码探秘(一)>中主要介绍了如何将gephi的源码导入myeclipse中遇到的一些问题,此篇接着上篇而来,主要讲解当下通过myeclipse导入gephi源码 ...

手机号码和电话号码合法性验证代码

手机号码和电话号码合法性验证代码: 在某些网站电话号码和手机号码都是必填的,或者说需要填写其中的一项,为了增强网站的真实性也提高用户体验,一般需要进行进行格式合法性验证,下面是摘自网络上的一段验证代码 ...

涅盘而生后的区块链正在如何影响金融，甚至全社会

互联网金融经历了野蛮生长之后也迎来了跑路.倒闭现象潮,同时人工智能.大数据.区块链等新科技正在引领互联网金融新的发展方向.尤其是区块链,这个从比特币中涅盘而生的创新技术,正在被人们认为可以重塑整个金融 ...

康复计划#1 再探后缀自动机&后缀树

本篇口胡写给我自己这样的东西都忘光的残废选手以及那些刚学SAM,看了其他的一些东西并且没有完全懵逼的人 (初学者还是先去看有图的教程吧,虽然我的口胡没那么好懂,但是我觉得一些细节还是讲清楚了的) 大 ...

主机与虚拟机不能通信

实验环境:window 7(host) +CentOS 6.5(virtual) 1.在装完了虚拟机之后,经常会出现虚拟机不能上网(默认:主机都是能上网的),不能与主机通信的情况.情况比较复杂啊!但是 ...

最近一次登录记录

SELECT ip FROM rc_record_login WHERE (uid, addtime) IN (SELECT uid,max(addtime) FROM rc_record_login ...

zookeeper 4 letter 描述与实践

命令示例描述 Conf echo conf | nc localhost 2181 (New in 3.3.0)输出相关服务配置的详细信息.比如端口.zk数据及日志配置路径.最大连接数,session ...

Windows内核分析——NtCreateDebugObject函数分析

第一篇分析Windows内核的文章,主要是加强学习记忆.以后会多写这种笔记,正如猪猪侠所说,所学的知识只有实践并且能够讲出来才能真正实现掌握. 程序来自ReactOS或WRK1.2 资料参考自< ...

查看linux服务器CPU数量

首先,要区分两个概念:物理CPU和逻辑CPU. 物理CPU就是服务器上实际安装的CPU.但是一个物理CPU可以有多个核.例如,一个 i5 760 是双核,而一个 i5 2250 是四核.如果开启了In ...

magento 安装其实很简单. 第一步,打开,你下载好的程序,找到php.ini.simple,根剧,这里面的的要求,来修改,你本地或服务器 php.ini的配制. 第二步,开始安装了(注意,先在你 ...

服务器网络配置

例如将服务器网络配置设置如下 IP:172.16.1.10 Mask:255.255.00 Gateway:172.16.1.1 DNS:202.0.20.106 设置如下: 先查看ip地址,此时ip ...

1007 级数求和

1007 级数求和 2002年NOIP全国联赛普及组时间限制: 1 s 空间限制: 128000 KB 题目等级 : 白银 Silver 题解查看运行结果题目描述 Description 已知: ...

Chapter 1 First Sight——7

Eventually we made it to Charlie's. 最终我们到了查理斯的家. He still lived in the small,two-bedroom house that ...

POJ 3176（Cow Bowling ）（就是简单的数塔，动态规划）

Cow Bowling Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 14206 Accepted: 9428 Desc ...

深入浅出Hyper-V网络虚拟化（序）

服务器虚拟化已经越来越普及,很多企业也都在尝试着将现有业务转换成虚拟化的方式来运行,即在一个物理服务器上虚拟出多个实例,而每个实例彼此隔离,就好像在使用一台真实主机一样:网络虚拟化也同样如此,在同一条 ...

2015-11-18 单词记录

ぃるご兄弟(きょうだい)はいますかいるよある机(つくえ)の上(うえ)に本があります居間(いま) 居間は.家(いえ)の中(なか)で家族(かぞく)が集まる(あつまる)場所(ばしょ)ですき公園 ...

self.view 的不当操作造成死循环

如题,在创建ContentView的时候,例子如下 NSString *viewClassName = NSStringFromClass([self class]); viewClassName = ...

使用NHibernate 2.1适配Sqlite数据库

配置NHibernate连接sqlite数据库文件,以HSqlite.cfg为例: <?xml version="1.0" encoding="utf-8" ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.029 s.