Secondary NameNode究竟是做什么的

Secondary NameNode:它究竟有什么作用？

在hadoop中，有一些命名不好的模块，Secondary NameNode是其中之一。从它的名字上看，它给人的感觉就像是NameNode的备份。但它实际上却不是。很多Hadoop的初学者都很疑惑，Secondary NameNode究竟是做什么的，而且它为什么会出现在HDFS中。因此，在这篇文章中，我想要解释下Secondary NameNode在HDFS中所扮演的角色。

从它的名字来看，你可能认为它跟NameNode有点关系。没错，你猜对了。因此在我们深入了解Secondary NameNode之前，我们先来看看NameNode是做什么的。

NameNode

NameNode主要是用来保存HDFS的元数据信息，比如命名空间信息，块信息等。当它运行的时候，这些信息是存在内存中的。但是这些信息也可以持久化到磁盘上。

上面的这张图片展示了NameNode怎么把元数据保存到磁盘上的。这里有两个不同的文件：

fsimage - 它是在NameNode启动时对整个文件系统的快照
edit logs - 它是在NameNode启动后，对文件系统的改动序列

只有在NameNode重启时，edit logs才会合并到fsimage文件中，从而得到一个文件系统的最新快照。但是在产品集群中NameNode是很少重启的，这也意味着当NameNode运行了很长时间后，edit logs文件会变得很大。在这种情况下就会出现下面一些问题：

edit logs文件会变的很大，怎么去管理这个文件是一个挑战。
NameNode的重启会花费很长时间，因为有很多改动[笔者注:在edit logs中]要合并到fsimage文件上。
如果NameNode挂掉了，那我们就丢失了很多改动因为此时的fsimage文件非常旧。[笔者注: 笔者认为在这个情况下丢失的改动不会很多, 因为丢失的改动应该是还在内存中但是没有写到edit logs的这部分。]

因此为了克服这个问题，我们需要一个易于管理的机制来帮助我们减小edit logs文件的大小和得到一个最新的fsimage文件，这样也会减小在NameNode上的压力。这跟Windows的恢复点是非常像的，Windows的恢复点机制允许我们对OS进行快照，这样当系统发生问题时，我们能够回滚到最新的一次恢复点上。

现在我们明白了NameNode的功能和所面临的挑战 - 保持文件系统最新的元数据。那么，这些跟Secondary NameNode又有什么关系呢？

Secondary NameNode

SecondaryNameNode就是来帮助解决上述问题的，它的职责是合并NameNode的edit logs到fsimage文件中。

下面我们来看一下SecondaryNameNode工作的流程，如下图：

　　1.NameNode管理着元数据信息，元数据信息会定期的刷到磁盘中，其中的两个文件是edits即操作日志文件和fsimage即元数据镜像文件，新的操作日志不会立即与fsimage进行合并，也不会刷到NameNode的内存中，而是会先写到edits中(因为合并需要消耗大量的资源)。当edits文件的大小达到一个临界值(默认是64MB)或者间隔一段时间(默认是1小时)的时候checkpoint会触发SecondaryNameNode进行工作。

　　2.当触发一个checkpoint操作时，NameNode会生成一个新的edits即上图中的edits.new文件，同时SecondaryNameNode会将edits文件和fsimage复制到本地。

　　3.SecondaryNameNode将本地的fsimage文件加载到内存中，然后再与edits文件进行合并生成一个新的fsimage文件即上图中的Fsimage.ckpt文件。

　　4.SecondaryNameNode将新生成的Fsimage.ckpt文件复制到NameNode节点。

　　5.在NameNode结点的edits.new文件和Fsimage.ckpt文件会替换掉原来的edits文件和fsimage文件，至此，刚好一个轮回即在NameNode中又是edits和fsimage文件了。

　　6.等待下一次checkpoint触发SecondaryNameNode进行工作，一直这样循环操作。

说明：新生成的edits.new应该是一个空文件，此时若NameNode元信息出现了改动，则会被写入到edits.new中。

　　Secondary NameNode的整个目的是在HDFS中提供一个检查点。它只是NameNode的一个助手节点。这也是它在社区内被认为是检查点节点的原因。现在，我们明白了Secondary NameNode所做的不过是在文件系统中设置一个检查点来帮助NameNode更好的工作。它不是要取代掉NameNode也不是NameNode的备份。所以从现在起，让我们养成一个习惯，称呼它为检查点节点吧。

　　Secondary NameNode是hadoop1.x中HDFS HA的一个解决方案，在实际的生产系统中只能减少系统宕机时丢失的数据量，减少系统重启时间，但是并不能降低NameNode宕机风险。在hadoop2.x中都是采用NameNode HA的解决方案！

参考链接：

http://blog.csdn.net/xh16319/article/details/31375197

http://www.cnblogs.com/thinkpad/p/5173705.html

时间： 2024-10-14 07:51:27

Secondary NameNode究竟是做什么的的相关文章

Secondary NameNode 的作用

https://blog.csdn.net/xh16319/article/details/31375197 很多人都认为,Secondary NameNode是NameNode的备份,是为了防止NameNode的单点失败的,其实并不是这样. Secondary NameNode:它究竟有什么作用? 在Hadoop中,有一些命名不好的模块,Secondary NameNode是其中之一.从它的名字上看,它给人的感觉就像是NameNode的备份.但它实际上却不是.很多Hadoop的初学者都很疑惑,

解读Secondary NameNode的功能

1.概述最近有朋友问我Secondary NameNode的作用,是不是NameNode的备份?是不是为了防止NameNode的单点问题?确实,刚接触Hadoop,从字面上看,很容易会把 Secondary NameNode当作备份节点:其实,这是一个误区,我们不能从字面来理解,阅读官方文档,我们可以知道,其实并不是这么回事,下面就来赘述下 Secondary NameNode的作用. 2.Secondary NameNode? 在Hadoop中,有一些命名模块不那么尽人意,Secondary

Hadoop之Secondary NameNode

NameNode存储文件系统的变化作为log追加在本地的一个文件里:这个文件是edits.当一个NameNode启动时,它从一个映像文件:FsImage,读取HDFS的状态,使用来自edits日志文件的 edits.然后它将写入新的HDFS状态到FsImage并开始平常操作,此时edits是一个空文件.由于NameNode合并FsImage和edits只在启动时,edits日志文件会变得很大在一段时间内并运行在繁忙的集群上 ,一个副作用是一个更大的edits文件会使NameNode在下次重新启动

Secondary NameNode

在Hadoop中,有一些命名不好的模块,Secondary NameNode是其中之一.从它的名字上看,它给人的感觉就像是NameNode的备份.但它实际上却不是.HDFS集群有两类节点以管理者和工作者的工作模式运行,namenode就是其中的管理者.它管理着文件系统的命名空间,维护着文件系统树及整棵树的所有文件和目录.这些信息以两个文件的形式保存于内存或者磁盘,这两个文件是:命名空间镜像文件fsimage和编辑日志文件edit logs ,同时namenode也记录着每个文件中各个块所在的数据

通过secondary namenode恢复崩溃的namenode

模拟namenode崩溃,将name目录的内容全部删除,然后通过secondary namenode恢复namenode. 环境:OS:Centos 6.5 x64 & Soft:Hadoop 1.2.1 1.进入name目录下,删除name目录内容. [[email protected] name]$ pwd/home/huser/hadoop/tmp/dfs/name [[email protected] name]$ lldrwxrwxr-x 2 huser huser 4096 4月 1

人必须弄清楚自己究竟想做什么

人必须弄清楚自己究竟想做什么,这是根本问题. 人的不同的阶段.不同的性格必然有不同的想法.行动. 以目前我的心态来看,主要有以下几点: 改变过于沉稳的心态,对已经习惯的工作.低效低激情的气氛有必要打破. 主动变化,最好当然是向着更高更快更强的地方走.但有时可能并没有最好.或者说前途一片光明的.适当变化.积极主动的尝试不同的.有益的东西,不仅可以可能可以发现更好的路线,最重要的是,养成一种不惧怕未来.用于改变.当断则断的思维,而不是过于沉稳保守.担心不确定性.不能接受变革. 多理解现实生活中的客观

secondary namenode和namenode分离

namenode 和 secondaryNamenode 运行在同一机器上,分离配置到新节点上. 环境:OS:Centos 6.5 x64 & Soft:Hadoop 1.2.1 master中的配置不是决定谁是namenode,而是决定谁是secondarynamenode.决定谁是namenode的配置是core-site.xml中的fs.default.name这个参数.master中记录secondnamenode的IP或主机名,可以同时配置多个secondnamenode. 1.修改m

NameNode和Secondary NameNode通信模型

NameNode将对文件系统的改动追加保存到本地文件系统上的一个日志文件edits.当一个NameNode启动时,它首先从一个映像文件(fsimage)中读取HDFS的状态,接着执行日志文件中的编辑操作.然后将新的HDFS状态写人fsimage中,井使用个空的edits文件开始正常操作.因为NameNode只有在启动阶段才合并fsimage和edits,久而久之日志文件可能会变得非常庞大,特别是对于大型的集群.日志文件太大的另一个副作用是下一次NameNode启动会很长世间,NameNode和S

secondary namenode 检查点

secondary namenode NameNode职责是管理元数据信息,DataNode的职责是负责数据具体存储,那么SecondaryNameNode的作用是什么?对很多初学者来说是非常迷惑的.它为什么会出现在HDFS中.从它的名字上看,它给人的感觉就像是NameNode的备份.但它实际上却不是. 大家猜想一下,当HDFS集群运行一段事件后,就会出现下面一些问题: ledit logs文件会变的很大,怎么去管理这个文件是一个挑战. lNameNode重启会花费很长时间,因为有很多改动要合并

猜你喜欢

Lua中调用 cocos2d-x 的滑动条/滚动条 ScrollView

ScrollView 我想玩儿过手机的朋友对滑动条都不陌生吧,(旁边: 这不是废话么???? ) 那好吧,废话不多说直接开始ScrollView吧 local m_BaseNode -- ...

C# 正则表达式入门

转自:http://www.cnblogs.com/KissKnife/archive/2008/03/23/1118423.html 另外推荐一篇学正则表达式的文章:http://www.unibe ...

file API

好的教程:http://blog.csdn.net/fwwdn/article/details/8349657/ FileEntry and DirectoryEntry FileList : fil ...

zabbix的api统计zabbix监控的主机数量与主机名

python通过zabbix的api获取监控的主机名和主机数量 #!/usr/bin/env python # -*- encoding: utf8 -*- #导入模块,urllib2是一个模拟浏览器 ...

web开发 HTML/CSS基本框架结构讲解

HTML/CSS基本框架结构讲解 <!DOCTYPE html> <html> <head> <meta charset="utf-8"& ...

ARM（CM3）的汇编指令

转http://blog.csdn.net/gaojinshan/article/details/11534569 16位数据操作指令名字功能ADC 带进位加法(ADD with Carry) ...

spring mvc 异常处理

1.编写全局异常处理类需要实现接口 org.springframework.web.servlet.HandlerExceptionResolver 2.自定义异常 3.测试程序 4.结果预期结果 ...

motion移植

一. 支持ffmpeg功能(使能motion中的视频编码功能)支持视频采集 —> ffmpeg不支持 —host 1. mkdir _install 2. ./configure —pref ...

clnt_create: RPC: Port mapper failure - Unable to receive: errno 113 (No route to host)

在NFS客户端执行该命令时报下列错误 [[email protected] ~]# showmount -e 192.168.0.1clnt_create: RPC: Port mapper fail ...

EF批量操作数据与缓存扩展框架

前言在原生的EF框架中,针对批量数据操作的接口有限,EF扩展框架弥补了EF在批量操作时的接口,这些批量操作包括:批量修改.批量查询.批量删除和数据缓存,如果您想在EF中更方便的批量操作数据,这个扩展 ...

监控运维系统实施方案--监控对象信息收集阶段

监控运维系统不是一件一蹴而就的事情,也不是一朝一夕就能轻易完成的,监控运维系统的规模与服务器规模和软件规模息息相关,需要仔细分析和筹划才能实现一个可用的监控运维系统. 为了直观的表示当前系统(除非 ...

centons7网卡配置文件使用openvswitch bridge

今天发现还有另外的方法给ovs添加bridge.绑定网卡等操作,此前我都是这般操作ovs-vsctl add-br br-ex; ovs-vsctl add-port br-ex eth0,这样操作的 ...

[MySQL优化] -- 如何定位效率较低的SQL

一般通过以下两种方式定位执行效率较低的 SQL 语句. 通过慢查询日志定位那些执行效率较低的 SQL 语句,用 --log-slow-queries[=file_name] 选项启动时, mysqld ...

tkinter学习-文本框

阅读目录 Entry 输入框 Text 文本框 Entry: 说明:输入控件,用于显示简单的文本内容属性:在输入框中用代码添加和删除内容,同样也是用insert()和delete()方法 from ...

XAMPP修改Apache默认网站目录htdocs的详解

XAMPP(Apache+MySQL+PHP+PERL)是一个功能强大的建 XAMPP 软件站集成环境包,大量站长在使用.正确安装好XAMPP后,默认是必须将php程序放到xampp\htdocs文件 ...

Java链式编程接口

在android开发中显示一个AlertDialog时,常采用下列的写法: new AlertDialog.Builder(getApplicationContext()) .setTitle(&qu ...

Oc(实例变量可见度与方法)(InstanceVariableAndMethod)

main函数 // // main.m // 2-3 LessionInstanceVariableAndMethod // // Created by lanouhn on 15/2/3. / ...

CSS3教程:Transform的perspective属性设置

1 2 <div id="animateTest" style="-webkit-transform: perspective(400px) rotateY(4 ...

Hibernate 事务提交和事务回滚

Hibernate 事务提交和事务回滚最近在用做hibernate做项目,一直不明白session.beginTransaction().commit() 和 session.beginTransa ...

Java的多线程+Socket

客户端: package com.wulala; import java.io.FileOutputStream;import java.io.IOException;import java.io.I ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.