Hadoop1.x与Hadoop2.x之间的差异

一.Hadoop2.x产生背景

　　1.Hadoop1.x中的HDFS和MapReduce在高可用、扩展性等方面存在问题。

　　2.HDFS存在的问题

　　　　1.NameNode单点故障，难以应用于在线场景。

　　　　2.NameNode压力过大，且内存受限，影响扩展性。

　　3.MapReduce存在的问题

　　　　1.JobTracker访问压力大，影响系统扩展性。

　　　　2.难以支持除MapReduce之外的计算框架，比如Spark、Strom等。

二.架构差异

　　1.Hadoop1.x由HDFS和MapReduce组成，不支持HA.

　　2.Hadoop2.x由HDFS、MapReduce和YARN三个分支组成，其中HDFS只支持2个节点HA【3.x支持一主多备】，MapReduce运行在YARN之上，YARN负责资源调度。

三.Hadoop2.x新特性

　　1.解决HDFS1.x中单点故障和内存受限的问题。通过主备NameNode使用HA解决单点故障问题。如果主NameNode发生故障，则切换到备NameNode之上。

　　2.解决内存受限问题，使用HDFS Federation机制，内存水平扩展，支持多NameNode。每个NameNode分管一部分目录，所有NameNode共享所有DataNode存储资源。

　　3.主NameNode对外提供服务，备NameNode同步主NameNode元数据，以待切换。

　　4.所有DataNode同时向两个NameNode汇报数据块信息。

四.切换方式

　　1.手动切换，通过命令实现主备之间的切换，可以用在HDFS升级等场合。

　　2.自动切换，基于Zookeeper。Zookeeper Failover Controller【ZKFC】会监控NameNode的健康状态，并向Zookeeper注册NameNode，当NameNode挂掉后，ZKFC为NameNode竞争锁，获得ZKFC锁的NameNode变为active。

五.Federation

　　

　　1.通过多个namenode/namespace把元数据的存储和管理分散到多个节点中，使得namenode/namespace可以通过增加机器来进行水平扩展。

　　2.能把单个namenode的负载分散到多个节点中，在HDFS数据规模较大的时候也不会降低HDFS的性能。可以通过多个namespace来隔离不同类型的应用，把不同类型应用的HDFS元数据的存储和管理分派给不同的namenode。

原文地址：https://www.cnblogs.com/yszd/p/10863695.html

时间： 2024-10-07 05:45:38

Hadoop1.x与Hadoop2.x之间的差异的相关文章

Hadoop1.x版本升级Hadoop2.x

引言随着企业数据化和Hadoop的应用越加广泛,hadoop1.x的框架设计越来越无法满足人们对需求,Apache一直在对Hadoop1.x进行修改,最后推出了新一代的Hadoop2.x.从业界使用分布式系统的变化趋势和 hadoop 框架的长远发展来看,MapReduce 的 JobTracker/TaskTracker 机制需要大规模的调整来修复它在可扩展性,内存消耗,线程模型,可靠性和性能上的缺陷.为从根本上解决旧 MapReduce 框架的性能瓶颈,促进 Hadoop 框架的更长远发展

Hadoop1.X 与 Hadoop2.X区别及改进

一:Haddop版本介绍 0.20.x版本最后演化成了现在的1.0.x版本 0.23.x版本最后演化成了现在的2.x版本 hadoop 1.0 指的是1.x(0.20.x),0.21,0.22 hadoop 2.0 指的是2.x,0.23.x CDH3,CDH4分别对应了hadoop1.0 hadoop2.0 二.Hadoop1.X与Hadoop2.X区别 1.HDFS的改进 1.1 Hadoop1.x时代的HDFS架构在Hadoop1.x中的NameNode只可能有一个,虽然可以通过Seco

大话Hadoop1.0、Hadoop2.0与Yarn平台

2016年12月14日21:37:29 Author:张明阳博文链接:http://blog.csdn.net/a2011480169/article/details/53647012 近来这几天一直在忙于Hbase的实验,也没有太静下心来沉淀自己,今天打算写一篇关于Hadoop1.0.Hadoop2.0与Yarn的博文,从整体上把握三者之间的联系,博客内容如有问题,欢迎留言指正!OK,进入本文正题-- 在开始接触Hadoop的时候,也许大家对于Hadoop是下面的一个概念:Hadoop由两部

Hadoop入门进阶步步高（六）-Hadoop1.x与Hadoop2的区别

六.Hadoop1.x与Hadoop2的区别 1.变更介绍 Hadoop2相比较于Hadoop1.x来说,HDFS的架构与MapReduce的都有较大的变化,且速度上和可用性上都有了很大的提高,Hadoop2中有两个重要的变更: l HDFS的NameNodes可以以集群的方式布署,增强了NameNodes的水平扩展能力和可用性: l MapReduce将JobTracker中的资源管理及任务生命周期管理(包括定时触发及监控),拆分成两个独立的组件,并更名为YARN(Yet Another Re

:nth-child和:nth-of-type之间的差异

对于 :nth-child : 先看下面的一段代码: <style> p:nth-child(1){ border: 1px solid; } </style> <div class="c1"> <div class="c11"> <p class="pp">1</p> <p class="pp">2</p> </div&g

PyQt 5.4参考指南 ---- PyQt5和PyQt4之间的差异

pyqt4只有440个类, pyqt5有1000个类 pyqt商业版本和开源版本没有功能区别,如果pyqt与gpl协议不兼容,则考虑购买pyqt商业版本. GPL协议,general public liscense代码开源协议 http://www.mamicode.com/info-detail-456379.html PyQt5 和 PyQt4 之间的差异 PyQt5不兼容PyQt4(尽管经验表明,将PyQt4的应用程序移植到PyQt5难度不是很大).本节描述了两者之间的主要差异. 支持Py

CSS3选择器:nth-child和:nth-of-type之间的差异（转）

原创文章,转载请注明来自张鑫旭-鑫空间-鑫生活[http://www.zhangxinxu.com] 本文地址:http://www.zhangxinxu.com/wordpress/?p=1709 参考文章:The Difference Between :nth-child and :nth-of-type 一.深呼吸,直接内容 :nth-child和:nth-of-type都是CSS3中的伪类选择器,其作用近似却又不完全一样,对于不熟悉的人对其可能不是很区分,本文就将介绍两者的不同,以便于大

CSS3选择器:nth-child和:nth-of-type之间的差异——张鑫旭

一.深呼吸,直接内容 :nth-child和:nth-of-type都是CSS3中的伪类选择器,其作用近似却又不完全一样,对于不熟悉的人对其可能不是很区分,本文就将介绍两者的不同,以便于大家正确灵活使用这两类选择器. 先看一个简单的实例,首先是HTML部分: <section> <p>我是第1个p标签</p> <p>我是第2个p标签</p>  </section> 然后两个选择器相对应的CSS

CSS3选择器:nth-child和:nth-of-type之间的差异的那些事儿

一.深呼吸,直接内容 :nth-child和:nth-of-type都是CSS3中的伪类选择器,其作用近似却又不完全一样,对于不熟悉的人对其可能不是很区分,本文就将介绍两者的不同,以便于大家正确灵活使用这两类选择器. 先看一个简单的实例,首先是HTML部分: <section> <p>我是第1个p标签</p> <p>我是第2个p标签</p>  </section> 然后两个选择器相对应的CSS

猜你喜欢

asp.net mvc 提交model 接收不了

[HttpPost] //[ValidateInput(false)] public ActionResult AddNews1(_54Young_News_Model.m ...

教您选购峰华手持IC卡读写机

教您选购峰华手持IC卡读写机:F8手持IC卡读写机采用32位ARM 9 内核微处理器,具备性能高.成本低.扩展性强等特点:使用Wince操作系统,具备多任务功能,提供了先进的维护和管理功能,极大地提高 ...

Linux下文件的特殊权限笔记

特殊权限: SUID,SGID,STICKY 安全上下文: 1.进程以某用户的身份运行;进程是发起此进程用户的代理,因此以此用户的身份和权限完成所有操作; 2.权限匹配: (1)判断进程的属主,是否为 ...

Java KeyNote

[Java KeyNote] 1.把一个ArrayList拷贝到另一个ArrayList. ArrayList list1=new ArrayList(); ArrayList list2=new A ...

To be or not to be

no.14 I leave no trace of wings in the air, but I am glad I have had my flight.--Rbindranath Tagore ...

好听的英文歌曲整理

我喜欢的歌曲 (歌名下面是评论,很有趣)1.歌名:Sugar 歌手:Maroon 5削个-椰子皮-你却TMD拿个梨微黑-而你-雷的我突然想放屁 2.歌名:Booty Music 歌手:Deep Si ...

JSON和JSONP

说到AJAX就会不可避免的面临两个问题,第一个是AJAX以何种格式来交换数据?第二个是跨域的需求如何解决?这两个问题目前都有不同的解决方案,比如数据可以用自定义字符串或者用XML来描述,跨域可以通过服 ...

Python--关于set

本文内容摘自慕课网<Pyrhon入门> 1.set 特性判断一个元素是否在set中速度很快. set存储的元素和dict的key类似,必须是不变对象,因此,任何可变对象是不能放入set中 ...

stm32f407启动文件分析

; Amount of memory (in bytes) allocated for Stack; Tailor this value to your application needs; < ...

1048: [HAOI2007]分割矩阵——记忆化搜索

http://www.lydsy.com/JudgeOnline/problem.php?id=1048 TML了一发 #include <iostream> #include <c ...

js第三方库CreateJs的使用

学习一下使用第三方js库 createjs ,官网分开了好几个不同用途的js库: EASELJS ,TWEENJS,SOUNDJS,PRELOADJS 同时也还有很多例子可以参考下面使用ease ...

Camel运行示例

这是一个很简单的Camel例子,代码如下: public static void main(String[] args) throws Exception { //创建Camel上下文 Default ...

ADO.NET快速入门——利用Command对象的ExecuteScalar()方法返回一个数据值

相关知识: 有些SQL操作,例如SUM,只会从数据库返回一个数据值,而不是多行数据尽管也可以使用ExecuteReader()返回一个DataReader对象,代表该数据值,但是使用Command对 ...

PHP, LDAPS and Apache

要PHP可以连接到用self-signed certificate的ldaps服务器,需要在/etc/ldap.conf中添加一行: TLS_REQCERT never 要PHP在Apache ...

如何解决mac下javac显示出乱码的问题。

进入终端1.输入cd ~2.输入 touch .bash_profile3.open -e .bash_profile 然后在bash_profile下输入export JAVA_TOOL_OPTIO ...

串替换

串替换:设串S="aqpbcderstbcdegh",子串T=“bcde",子串V="ff",实现子串V替代所有主串S中出现的和子串T相等的不重叠的子 ...

替换文件中某个字符串并写入新内容（Java代码实现）

import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.Fi ...

hdu 5018 Revenge of Fibonacci(BestCoder Round #10)

Revenge of Fibonacci Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Oth ...

移动端页面切换方案

//css.onpage {position:fixed;position:absolute; left:0; top:0; width:100%; height:100%; background: ...

Spark：大数据的电花火石！

什么是Spark?可能你很多年前就使用过Spark,反正当年我四六级单词都是用的星火系列,没错,星火系列的洋名就是Spark. 当然这里说的Spark指的是Apache Spark,Apache Sp ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.019 s.