什么是NameNode和DataNode？他们是如何协同工作的？

[学习笔记]

什么是NameNode和DataNode？他们是如何协同工作的？马克-to-win @ 马克java社区：一个HDFS集群包含一个NameNode和若干的DataNode（start-dfs命令就启动了NameNode和DataNode）， NameNode是管理者，主要负责管理hdfs文件系统，具体包括namespace命名空间管理（即目录结构）和block管理。DataNode主要用来存储数据文件，因为文件可能巨大无比（大数据，大于1TB），HDFS将一个文件分割成一个个的block，这些block可能存储在一个DataNode上或者多个DataNode上。DataNode负责实际的底层的文件的读写。马克-to-win @ 马克java社区：举个例子：如果客户端client程序发起了读hdfs上的某个文件的指令， NameNode首先将找到这个文件对应的block，然后NameNode告知client，这些block数据在哪些DataNode上，之后， client将直接和DataNode交互。

文章转载自原文：https://blog.csdn.net/mark_to_win/article/details/90240724

原文地址：https://www.cnblogs.com/haima1949/p/10988796.html

时间： 2024-10-10 00:01:18

什么是NameNode和DataNode？他们是如何协同工作的？的相关文章

HDFS体系结构(NameNode、DataNode详解)

hadoop项目地址:http://hadoop.apache.org/ 分布式文件系统概述: 数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配到更多的操作系统管理的磁盘中,但是不方便管理和维护,因此迫切需要一种系统来管理多台机器上的文件,这就是分布式文件管理系统 . 是一种允许文件通过网络在多台主机上分享的文件系统,可让多机器上的多用户分享文件和存储空间. 通透性.让实际上是通过网络来访问文件的动作,由程序与用户看来,就像是访问本地的磁盘一般. 容错.即使系统中有某些节点脱机,整体

Hadoop介绍-4.Hadoop中NameNode、DataNode、Secondary、NameNode、JobTracker TaskTracker

Hadoop是一个能够对大量数据进行分布式处理的软体框架,实现了Google的MapReduce编程模型和框架,能够把应用程式分割成许多的小的工作单元,并把这些单元放到任何集群节点上执行.在MapReduce中,一个准备提交执行的应用程式称为「作业(job)」,而从一个作业划分出得.运行于各个计算节点的工作单元称为「任务(task)」.此外,Hadoop提供的分布式文件系统(HDFS)主要负责各个节点的数据存储,并实现了高吞吐率的数据读写. 在分布式存储和分布式计算方面,Hadoop都是用

HDFS中的NameNode和DataNode

HDFS集群中以Master-Slave模式运行,主要有两类节点:一个Namenode节点(即master)和多个Datanode节点.Namenode管理文件系统的Namespace.他维护着文件系统树以及文件树中所有的文件和文件夹的元数据. hdfs架构图: Namenode: Namenode管理文件系统的Namespace.它维护着文件系统树以及文件树中所有的文件和文件夹的元数据(Metadata).管理这些信息的文件有两个,分别是Namespace镜像文件(Namespace imag

NameNode和DataNode间的联系

本文内容还是转载自--吴超沉思录里的,还是挺佩服吴超老师的O(∩_∩)O~ 以下介绍NameNode和DataNode所扮演的角色: (1)NameNode NameNode的作用是管理文件目录结构,是管理数据节点的.NameNode维护两套数据:一套是文件目录与数据块之间的关系,另一套是数据块与节点间的关系.前一套是静态的,是存放在磁盘上的,通过fsimage和edits文件来维护:后一套数据是动态的,不持久化到磁盘,每当集群启动的时候,会自动建立这些信息. (2)DataNode DataN

hadoop中NameNode、DataNode和Client三者之间协作关系及通信方式介绍

1)NameNode.DataNode和Client NameNode可以看作是分布式文件系统中的管理者,主要负责管理文件系统的命名空间.集群配置信息和存储块的复制等.NameNode会将文件系统的Meta-data存储在内存中,这些信息主要包括了文件信息.每一个文件对应的文件块的信息和每一个文件块在DataNode的信息等. DataNode是文件存储的基本单元,它将Block存储在本地文件系统中,保存了Block的Meta-data,同时周期性地将所有存在的Block信息发送给NameNod

04 namenode和datanode

namenode元数据管理 1.什么是元数据? hdfs的目录结构及每一个文件的块信息(块的id,块的副本数量,块的存放位置<datanode>) 2.元数据由谁负责管理? namenode 3.namenode把元数据记录在哪里? namenode的实时的完整的元数据存储在内存中: namenode还会在磁盘中(dfs.namenode.name.dir)存储内存元数据在某个时间点上的镜像文件: namenode会把引起元数据变化的客户端操作记录在edits日志文件中: namenode主要

Hadoop中NameNode、DataNode和Client三者之间的通信方式是什么？怎样进行合作？

一直没有重视三者之间的通信问题,在此整理一下提问:datanode之间有没有交互?Hadoop安装时ssh如何配置? 1.背景知识: 在Hadoop系统中,master/slaves/client的对应关系是:master---namenode:slaves---datanode:client---dfsclient:通信方式简单地讲:client和namenode之间是通过rpc通信:datanode和namenode之间是通过rpc通信:client和datanode之间是通过简单的sock

hadoop学习笔记--NameNode和DataNode以及容错处理

概念: HDFS会把一个很大的文件分块(与传统的文件系统类似),存放在不同的DataNode上.不过这个块是个逻辑概念,比较大,默认是64M. Hadoop以"管理者-工作者"模式运行.NameNode就是管理者,它保存了文件系统中所有文件以及目录信息.也记录了每个文件的分块信息.但这些分块具体在哪些机器上存储则由DataNode自己上报. 容错: NameNode的容错: 所有的文件访问都要通过NameNode来进行,所以NameNode至关重要.一旦NameNode发生毁坏,则整个

重新格式化hadoop的namenode导致datanode无法启动的最简单解决办法

一般namenode只格式化一次,重新格式化不仅会导致之前的数据都不可用,而且datanode也会无法启动.在datanode日志中会有类似如下的报错信息: java.io.IOException: Incompatible clusterIDs in /tmp/hadoop-root/dfs/data: namenode clusterID = CID-7f25bc20-e822-4b15-9063-4da48884cb60; datanode clusterID = CID-911d3bd8

猜你喜欢

ubuntu12.04 mysql 添加表字段

1.登录数据库 2.切换数据库 3.增加字段 ap_record表增加字段status类型为int不能为空 alter table ap_record add status int not null;

CentOS系统启动流程

POST(加电自检):检测硬件在CPU的控制下,将RAM芯片中的某个程序映射到ROM地址空间,并执行其中的指令完成系统硬件健康状况检查,例如存储设备.网卡.CPU.声卡等硬件设备是否完好.当检查完成后 ...

Linux内核------进程的基本知识

进程: 传统上,Linux操作系统下运行的应用程序,服务器和其他程序都称为进程.当然进程不仅仅表示一段处于执行期的可执行代码,还包括其他资源,例如打开的文件,挂起的信号和内核内部数据等.其实还有个概念 ...

Static File Middleware

[ASP.NET Core] Static File Middleware 前言本篇文章介绍ASP.NET Core里,用来处理静态档案的Middleware,为自己留个纪录也希望能帮助到有需要的开 ...

CentOs7

http://www.sa-log.com/276.html 关于命令和操作系统简单优化的步骤如下: ———————————-大家好,我是分割线,虽然我并不华丽———————————- 网络命令参考 ...

awk删除文件第一列

1.采用awk awk '{$1="";print $0}' file 2.采用sed sed -e 's/[^]* //' file sort -R file 随机排列文件

委托，不知道你是否有也这样理解（一）

目录: 什么是委托委托的作用委托的本质委托链委托链返回值一.什么是委托? 委托:将符合规则的方法进行包装.装载方法引用的盒子.将方法作为参数传递. class Program { stati ...

Java调用SMSLib发送短信详解

项目中需要用到发送短信功能,之前没做过这方面,找人咨询了一下,也网上查了查,发现并不是很复杂.目前项目已经完成了,做个记录以备后用.程序中发送短信主要有4种方法: 1.向当地的运营商申请网关,不需要额 ...

题目1052：找x

时间限制:1 秒内存限制:32 兆题目描述: 输入一个数n,然后输入n个数值各不相同,再输入一个值x,输出这个值在这个数组中的下标(从0开始,若不在数组中则输出-1). 输入: 测试数据有多组,输 ...

ATL正则表达式库与CAtlRegExp的使用

正则表达式是最强大的文本解析工具之一, 在ATL中也提供了一些用于正则表达式的类库(CATLRegExp等),本文将简要说明这些类库的使用方法. 1.CATLRegExp类声明: template ...

HTML&PHP学习笔记（3）

打开文件: $fp = fopen("$_SERVER['DOCUMENT_ROOT']/...../a.txt",'w'); 需保证apache有权限读写写入文件: fwrit ...

cool1 dual生态手机的产品经：基于体验基础的商业模式变革

在互联网经济.社交红利等话题日趋成为新商业模式的今天,"免费"一词是最常被见诸媒体端的高频词汇.在"免费"引发的行业洞察趋向和商业浪潮面前,不少人士均纷纷提出& ...

JSP之使用useBean、setProperty、getProperty指令

useBean指令用于在JSP页面中初始化一个Java实例,setProperty指令用于为JavaBean实例的属性设置值,getProperty指令用于输出JavaBean实例的属性. 例子: J ...

【转】树莓派初次启动攻略for Mac

http://blog.csdn.net/rk2900/article/details/8632713/ 树莓派初次启动攻略for Mac made by Rk 感谢浙江大学<嵌入式系统> ...

正则之环视

正则之环视 regex 1.环视基础 2.示例至少包含不重复分隔数字标签 3.环视匹配原理顺序环视匹配过程逆序环视匹配过程 4. 环视应用参考: 正则基础之环视 Lookaround ...

silverlight教程 silverlight 数据绑定

以往为了做wtt测试,曾经写过一个sample 的WPF application.对于silverlight的了解,仅限于是web 版的WPF..... 关于silverlight,以前也做过一个sa ...

精准化测试专业平台Paw：苹果APP应用代码质量的守护者

众所周知,一款苹果APP进入苹果应用商店后,要上排行榜,要被首页推荐,版本更新必不可少,但作为版本更新的关键所在,软件测试一直被业内吐槽“坑太多”,缺陷防不胜防.相关经验缺乏等等.若问如何“填坑”?以 ...

OSChina 周三乱弹 —— 领悟人生，一百块钱都不给？

周三了,小小编也终于回到了深圳,甚是开森啊,终于不再折腾了.不过还是好累啊,小小编是爬着起来的,估计现在也还不清醒,没睡醒的时候好像总会想很多事情,然后就忘了,忘了... @javayfs : 今天还 ...

POJ - 3468 A Simple Problem with Integers （区间求和）

Description You have N integers, A1, A2, ... , AN. You need to deal with two kinds of operations. On ...

微信公众平台接入经验分享，纯干货

这篇文章是千米网移动团队半年多时间使用微信平台开发多租户微店系统相关经验的分享与记录,涉及微信JSSDK,消息推送,微店支付等方面,微信开发的坑实在太多了,早期的时候官方文档也有不少问题,网上相关的资 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.023 s.