分布式计算hadoop三大组件

设计原则:移动计算,而不是移动数据

计算层:Map/Reduce
调度层:YARN
数据层:HDFS

这三层之间没有必然的依赖性,只是经常这么搭配,而且都是hadoop那个包里一起安装的,三层都可以独立运行,某一层或者某两层换成其他的而另外两层或者一层不换也是可以的

YARN 调度系统
  ResourceManager
  NodeManager
HDFS 存放数据
  NameNode
  DataNode

当有一个计算任务到来的时候,首先访问YARN的ResourceManager然后将计算分发给一个或多个NodeManager,由NoadManager执行真正的计算

YARN和HDFS都是主从结构,都是为大数据处理来服务的

通常情况下:

YARN的NodeManage和HDFS的DataNode分别部署在同一台机器上(计算和数据在同一台机子上)

YARN的ResourceManager和HDFS的NameNode通常会各自占用一台机器(因为两个都很废内存)

但这并不是必须的,

ResourceManager可以和NameNode可以在同一台机器上

NodeManager也可以和DataNode也可以在不同的机器上

YARN和HDFS在逻辑上是独立的,可以相互配合也可以独立使用,各自都可以单独启动,只不过他们两个都在Hadoop下

原文地址:https://www.cnblogs.com/413xiaol/p/9961007.html

时间: 2024-11-04 16:12:20

分布式计算hadoop三大组件的相关文章

Hadoop三大组件以及Hive的基础认知

Hadoop三大组件: 分布式文件系统:HDFS —— 实现将文件分布式存储在很多的服务器上(分布式存储) 分布式运算编程框架:MapReduce——实现多台机器的分布式并行运算.(分布式运算) 分布式资源调度平台:YARN —— 帮用户调度大量的mapreduce程序,并合理分配运算资源 Hive 入门 Hive构建在Hadoop上 HQL中对查询语句的解释.优化.生成查询计划是由Hive完成的所有的数据存储在Hadoop上. 查询计划被转化为 MapReduce 任务(job),在 Hado

hadoop三大组件的简单图解

如有不对,欢迎大家指正

Hadoop 三大调度器分析

如要转载,请注上作者和出处. 须知: 我们下载的是hadoop-2.7.3-src 源码. 这个版本默认调度器是Capacity调度器. 在2.0.2-alpha版本的时候,有人汇报了一个fifo调度器的bug,社区把默认调度器从原来的fifo切换成capacity了. 在Hadoop中,调度器是一个可插拔的模块,用户可以根据自己的实际应用要求设计调度器,然后在配置文件中指定相应的调度器,这样,当Hadoop集群启动时,便会加载该调度器.当前Hadoop自带了几种调度器,分别是FIFO(默认调度

Hadoop以及组件介绍

一.背景介绍 在接触过大数据相关项目的时候常常都会听到Hadoop这个东西,简单来说,他是一个用分布式计算来处理大数据的开源软件,下面包含了许多的组件和子项目,这篇文章将会介绍Hadoop的原理以及一些组件的应用. 二.准备工作 1.确认储存规模 有很多的大数据项目其实数据量跟本没这么大,跟本不需要到使用Hadoop这类的大数据软件,所以,第一步应该是先确认数据量有多大,真的MySQL跑的太久再去使用Hadoop就好. 2.确认数据类型 除了结构化数据以外,现在有些大数据项目需要处理的是一些非结

学习笔记_过滤器概述(过滤器JavaWeb三大组件之一)

过滤器Filter Filter和Lister是Servlet规范里的两个高级特性.不同于Servlet,它们不用于处理客户端请求,只用于对request.response进行修改或者对context.session.request事件进行监听. Filter意为滤镜或者过滤器,用于Servlet之外对request或者response进行修改.Filter提出了滤镜链的概念,一个Filterchain包括多个F 1 什么是过滤器 过滤器JavaWeb三大组件之一,它与Servlet很相似!不它

Struts——三大组件(二)RequestProcessor

RequestProcessor ActionServlet是Struts框架里唯一一个Servlet,它负责处理所有请求.它无论何时收到一个请求,都会首先试着为现有请求找到一个子应用.一旦子应用被找到,它会为其生成一个RequestProcessor对象,并调用传入HttpServletRequest和HttpServletResponse为参数的process()方法. 一.RequestProcessor.process() java代码: public void process(Http

Struts——三大组件(三)Action

Action Action是Struts中的基础组件.我们学过了Struts的执行流程,处理最终都会调到一个Action类:我们在Action中取得表单数据:进行业务逻辑处理:页面转发.传递等. 一.配置文件 <actionpath="/login" type="struts.LoginAction" name="loginForm" scope="request" > 二.Action代码 生成Action后,当

Struts——三大组件(一)ActionServlet

ActionServlet类是Struts框架的内置核心控制器组件,它继承了javax.servlet.http.HttpServlet类,Struts的启动一般从加载ActionServlet开始,因此它在MVC模型中扮演中央控制器的角色,负责接受用户请求,返回给用户合适的视图组件.控制器将模型层和视图层分开,这样分离,可以为同一个模型开发出不同的视图. 下面是Struts的三大主要组件: ActionServlet组件:充当Struts框架的中央控制器:Struts应用中只存在ActionS

JavaWeb三大组件—过滤器filter

JavaWeb三大组件 1. 都需要在web.xml中进行配置ServletListener(2个感知监听器不需要配置)Filter 2. 过滤器 它会在一组资源(jsp.servlet..css..html等等)的前面执行! 它可以让请求得到目标资源,也可以不让请求达到! * 过滤器有拦截请求的能力! 登录:允许它访问AServlet.BServlet.CServlet ------------------------------- 过滤器如何编写 1. 写一个类实现Filter接口2. 在w