认识YARN

YARN（Yet Another Resource Negotiator），它是统一的资源管理平台，是在Hadoop2.0中才出现的一个组件。

YARN是Hadoop的处理层，包含资源管理器和作业调度器。它在它的资源管理器中去分配好队列，这个队列划分可以根据业务规则，根据技术的模块进行划分，比如同时拥有hive和hbase的应用，我可以为hive分配多少内存，分配多少cpu,为hbase分配多少资源，优先级多少等等。

YARN允许多个数据处理引擎同时运行在单个集群上，比如：

批处理程序（比如：Spark，MapReduce）

交互式SQL（比如：Impala）

高级分析（比如：Spark，Impala）

流处理（比如：Spark Streaming）

了解了YARN的特点，那么YARN资源管理的进程是怎样的呢？

第一步：Resource Manager（RM）：运行在master节点，全局资源调度。

第二步：Node Manager（NM）：运行在slave节点，跟RM通信

第三步：Containers：在Slave节点上分配特定量的资源（内存，CPU），应用运行在一个或多个containers上。

第四步：Application Master（AM）：每个应用一个，请求更多的containers来运行应用任务。

以上关于YARN的介绍是自己的一些理解和认知，至于YARN的架构以及其他方面的知识，想了解的可以自己去查询学习。我平常的时候喜欢关注大数据cn这样的微信公众号码去了解一些知识，有兴趣的也可以去看看，希望大家多多分享，共同进步！

时间： 2024-09-27 02:40:42

认识YARN的相关文章

Apache Hadoop集群离线安装部署(一)——Hadoop(HDFS、YARN、MR)安装

虽然我已经装了个Cloudera的CDH集群(教程详见:http://www.cnblogs.com/pojishou/p/6267616.html),但实在太吃内存了,而且给定的组件版本是不可选的,如果只是为了研究研究技术,而且是单机,内存较小的情况下,还是建议安装Apache的原生的集群拿来玩,生产上自然是Cloudera的集群,除非有十分强大的运维. 我这次配了3台虚拟机节点.各给了4G,要是宿主机内存就8G的,可以搞3台2G,应该也是ok的. 〇.安装文件准备 Hadoop 2.7.3:

如何通过Java程序提交yarn的mapreduce计算任务

由于项目需求,需要通过Java程序提交Yarn的MapReduce的计算任务.与一般的通过Jar包提交MapReduce任务不同,通过程序提交MapReduce任务需要有点小变动,详见以下代码. 以下为MapReduce主程序,有几点需要提一下: 1.在程序中,我将文件读入格式设定为WholeFileInputFormat,即不对文件进行切分. 2.为了控制reduce的处理过程,map的输出键的格式为组合键格式.与常规的<key,value>不同,这里变为了<TextPair,Valu

由“Beeline连接HiveServer2后如何使用指定的队列（Yarn）运行Hive SQL语句”引发的一系列思考

背景我们使用的HiveServer2的版本为0.13.1-cdh5.3.2,目前的任务使用Hive SQL构建,分为两种类型:手动任务(临时分析需求).调度任务(常规分析需求),两者均通过我们的Web系统进行提交.以前两种类型的任务都被提交至Yarn中一个名称为“hive”的队列,为了避免两种类型的任务之间相互受影响以及并行任务数过多导致“hive”队列资源紧张,我们在调度系统中构建了一个任务缓冲区队列,所有被提交的任务(手动任务.调度任务)并不会直接被提交至集群,而是提交至这个缓冲区队列中,

Yarn 调度器Scheduler详解

理想情况下,我们应用对Yarn资源的请求应该立刻得到满足,但现实情况资源往往是有限的,特别是在一个很繁忙的集群,一个应用资源的请求经常需要等待一段时间才能的到相应的资源.在Yarn中,负责给应用分配资源的就是Scheduler.其实调度本身就是一个难题,很难找到一个完美的策略可以解决所有的应用场景.为此,Yarn提供了多种调度器和可配置的策略供我们选择. 一.调度器的选择在Yarn中有三种调度器可以选择:FIFO Scheduler ,Capacity Scheduler,FairS ched

centos7安装nodejs 和 yarn

如何从EPEL库安装Node.js 另一个有效且简单的方法来安装Node.js就是从官方库.这同样确保您可以访问到EPEL库,你可以通过运行以下命令. sudo yum install epel-release 现在可以使用yum命令安装Node.js了. sudo yum install nodejs 在 CentOS.Fedora.RHEL 上,你可以通过 RPM 包仓库安装 Yarn. sudo wget https://dl.yarnpkg.com/rpm/yarn.repo -O /e

Yarn 详解

唐清原, 咨询顾问简介: 本文介绍了 Hadoop 自 0.23.0 版本后新的 map-reduce 框架(Yarn) 原理,优势,运作机制和配置方法等:着重介绍新的 yarn 框架相对于原框架的差异及改进:并通过 Demo 示例详细描述了在新的 yarn 框架下搭建和开发 hadoop 程序的方法. 读者通过本文中新旧 hadoop map-reduce 框架的对比,更能深刻理解新的 yarn 框架的技术原理和设计思想,文中的 Demo 代码经过微小修改即可用于用户基于 hadoop 新

大话Hadoop1.0、Hadoop2.0与Yarn平台

2016年12月14日21:37:29 Author:张明阳博文链接:http://blog.csdn.net/a2011480169/article/details/53647012 近来这几天一直在忙于Hbase的实验,也没有太静下心来沉淀自己,今天打算写一篇关于Hadoop1.0.Hadoop2.0与Yarn的博文,从整体上把握三者之间的联系,博客内容如有问题,欢迎留言指正!OK,进入本文正题-- 在开始接触Hadoop的时候,也许大家对于Hadoop是下面的一个概念:Hadoop由两部

MapReduce 学习6 ---- hadoop2提交到Yarn： Mapreduce执行过程分析

hadoop2提交到Yarn: JOB提交过程 http://www.aboutyun.com/forum.php?mod=viewthread&tid=9366&highlight=hadoop2%CC%E1%BD%BB%B5%BDYarn hadoop2提交到Yarn: Map执行过程 http://www.aboutyun.com/forum.php?mod=viewthread&tid=9370&highlight=hadoop2%CC%E1%BD%BB%B5%BD

Hadoop学习14--Hadoop之一点点理解yarn

yarn是一个分布式的资源管理系统. 它诞生的原因是原来的MapReduce框架的一些不足: 1.JobTracker单点故障隐患 2.JobTracker承担的任务太多,维护Job状态,Job的task的状态等 3.在taskTracker端,使用map/reduce task表示资源过于简单,没有考虑cpu.内存等使用情况.当把多个需要消耗大量内存的task调度到一起时,很容易出现问题演化后的基本组件下面具体解释: yarn是一个资源管理的框架,而非计算的框架,理解这点很重要. 图中的A

猜你喜欢

人的提升不是直线上升的，也不是一直弧线上升的（人之所以有文明就是因为不断的学习和积累好的东西）

正确的积累经验: 在实际工作中,要学习好的习惯,虽然你现在并不赞同,但是你要学习,并一直保持下去,因为人之所以有文明就是因为不断的学习和积累好的东西. 不要盲目赞同别人,要先思考,要有自己的立场. 不 ...

首次开通，欢迎来访

一直想着记录自己的成长与工作,可忙碌的生活与工作,让我唯唯诺诺. 时至今日,决定以一个旁观者到心态重新温故一下,并以文章记录,以慰籍那曾经的心. 每句话,每个字,都是手工打造,话糙理不糙,跟随我一起翻 ...

8、循环体与文件

顾名思义,就是通过循环体执行对文件的操作. 1.while 对于文件的读取,使用 read 的话,是一次性全部读取出来,对于特别大的文件的话,那么就可以使用 readline 函数,每次读取一行,返回 ...

系统栈的工作原理(转)

1.开篇本篇文章着重写的是系统中栈的工作原理,以及函数调用过程中栈帧的产生与释放的过程,有可能名字过大,如果不合适我可以换一个名字,希望大家能够指正,小丁虚心求教!如果有哪里写的不清楚的或者错误的地 ...

Java JDBC连接SQL Server2005错误：通过port 1433 连接到主机 localhost 的 TCP/IP 连接失败

错误原因例如以下: Exception in thread "main" org.hibernate.exception.JDBCConnectionException: Cann ...

构建自己的PHP框架--定义ORM的接口

在上一篇博客中,我们抽象出了Controller的基类,实现了页面的渲染和返回JSON字符串的功能. 那作为一个框架,我们现在还缺少什么?是的,大家应该已经注意到了,我们在这之前从来没有连接过数据库, ...

程序员的健康之路

当我第一次听到加班的时候,其实我是是拒绝的,我对领导说我拒绝:领导说可以加工资,就这样我加了一个月的班之后,我的工资就DUANG的一下,上去了. 之后我每个月都在加班,我也告诉我身边的朋友加班,白天不 ...

OC语法1——OC概述

Object-C简介: OC,即Object-C,iOS开发的核心语言.它是基于C语言的,在C的基础上做了面向对象的封装,所以OC是面向对象的语言.同时也因此OC是兼容C的,也就是说在iOS开发中,可 ...

mac终端命令查看隐藏的.svn文件

defaults write com.apple.Finder AppleShowAllFiles YES 在终端中执行以上命令,然后在Finder上alt+右键,点重新开启,就可以查看文件夹下的隐藏 ...

小妖精的完美游戏教室——魔方塔防01，路径

今天也要直播魔法,求科学的! 欢迎来到小妖精Balous的完美游戏教室! 现在呢,小妖精要教大家如何制作一个游戏,是不是很激动呢?小妖精现在也是很兴奋呀.废话不多说,我们直接进入正题.作为一个游戏,必 ...

php入门第一篇

1.php用途: a.生成动态页面内容 b.创建,打开,读取,写入,关闭服务器上的内容 c.收集表单内容 d.发送和接受cookies. e添加,删除,修改自己数据库中的数据. e.限制用户访问自己网 ...

JavaSE_ 多线程总目录(23~24)

黑马程序员_JavaSE学习总结第23天_多线程123.01 多线程程序的引入23.02 进程概述及多进程的意义23.03 线程概述及多线程的意义23.04 并行和并发的区别23.05 Java程序运 ...

JDBC 增删查改

public class MemberDaoImpl implements MemberDao { private Connection conn = null; public MemberDaoIm ...

机器学习如何入门

作者:Leon链接:https://www.zhihu.com/question/20691338/answer/102249162来源:知乎著作权归作者所有.商业转载请联系作者获得授权,非商业转载请 ...

希尔堆快排

1.希尔排序 (1).算法思想:希尔排序是插入排序的改良算法,增加了一个步长step,每次插入排序使步长为step的元素形成一个递增序列,然后缩小增量,继续插入,直至step=1时,就是插入排序了,此 ...

在Linux下搭建Git服务器的方法是什么样？

第一步安装git:可以通过命令的方式快速安装,不同的linux的安装方法可能不一样,我的是采用的yum方法.ubuntu可以用apt-get命令. sudo yum install git 第二步 ...

魔术方法和关键字

魔术方法 //1.构造函数对类里面成员进行初始化 function __construct() { } //析构函数在对象释放的时候自动执行 function __destruct() { } / ...

Nim连接到Python

原文:https://akehrer.github.io/nim/2015/01/24/connecting-nim-to-python.html 在以前的文章中在最后询问了关于Nim连接Python ...

C#去除HTML标签

public static string ReplaceHtmlTag(string html, int length = 0) { string strText = System.Text.Regu ...

RMAN恢复案例之--完全恢复错误案例(备份Error）

RMAN恢复案例: 用户在做rman的恢复时遇到以下错误: RMAN> restore database from tag='TAG20140923T160003'; Starting rest ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.022 s.