spark基于yarn的两种提交模式

一、spark的三种提交模式

1、第一种，Spark内核架构，即standalone模式，基于Spark自己的Master-Worker集群。

2、第二种，基于YARN的yarn-cluster模式。

3、第三种，基于YARN的yarn-client模式。

如果，你要切换到第二种和第三种模式，在提交spark应用程序的spark-submit脚本加上--master参数，设置为yarn-cluster，或yarn-client，即可。如果没设置，那么，就是standalone模式。

一、基于YARN的yarn-client模式

二、基于YARN的yarn-cluster模式

三、yarn-cluster和yarn-client区别

1, yarn-client用于测试，因为,driver运行在本地客户端,负责调度application ,会与yarn集群产生超大量的网络通信，从而导致网卡流星激增，可能会被SA (运维)给警告。优点是，直接执行时，本地可以看到所有的log，方便调试.

2, yarn-cluster ，用于生产环境，因为driver运行在nodemanager ，没有网卡流星激增的问题。缺点在于，调试不方便，本地用spark-submit堤交后,看不到log，只能通过yarn applicaition-logs application_id这种命令来查看，麻烦

如果spark不依托于yarn，或者就是搭建一个spark集群，底层基于hdfs、hive大数据操作，或者hadoop版本低，没有yarn，就用standalone模式即可，

建议，做成分布式，提交应用的机器做成分布式（多几台），在实际提交的时候能够负载均衡，在不同的机器上面去提交，避免单台机器网卡流量激增问题，

原文地址：https://www.cnblogs.com/suwy/p/9510939.html

时间： 2024-11-05 11:47:36

spark基于yarn的两种提交模式的相关文章

spark on yarn的两种提交方式

和yarn-cluster模式一样,整个程序也是通过spark-submit脚本提交的.但是yarn-client作业程序的运行不需要通过Client类来封装启动,而是直接通过反射机制调用作业的main函数.下面就来分析: 1.通过SparkSubmit类的launch的函数直接调用作业的main函数(通过反射机制实现),如果是集群模式就会调用Client的main函数. 2.而应用程序的main函数一定都有个SparkContent,并对其进行初始化: 3.在SparkContent初始化中将

Spark on yarn的两种模式 yarn-cluster 和 yarn-client

从深层次的含义讲,yarn-cluster和yarn-client模式的区别其实就是Application Master进程的区别,yarn-cluster模式下,driver运行在AM(Application Master)中,它负责向YARN申请资源,并监督作业的运行状况.当用户提交了作业之后,就可以关掉Client,作业会继续在YARN上运行.然而yarn-cluster模式不适合运行交互类型的作业.而yarn-client模式下,Application Master仅仅向YARN请求ex

Spark on YARN两种运行模式介绍

本文出自:Spark on YARN两种运行模式介绍http://www.aboutyun.com/thread-12294-1-1.html(出处: about云开发) 问题导读 1.Spark在YARN中有几种模式? 2.Yarn Cluster模式,Driver程序在YARN中运行,应用的运行结果在什么地方可以查看? 3.由client向ResourceManager提交请求,并上传jar到HDFS上包含哪些步骤? 4.传递给app的参数应该通过什么来指定? 5.什么模式下最后将结果输

flink on yarn模式下两种提交job方式

flink on yarn模式下两种提交job方式 https://juejin.im/post/5bf8dd7a51882507e94b8b15 https://www.cnblogs.com/asker009/p/11327533.html https://ci.apache.org/projects/flink/flink-docs-release-1.9/ops/deployment/yarn_setup.html#flink-yarn-session 原文地址:https://www.

Spark两种提交方式Yarn-client and Yarn-cluster

Spark支持三种集群部署方式(Standalone,Mesos,Yarn),其中Master服务(Spark Standalone,Mesos Master,Yarn ResourceManager)决定哪些应用可以运行,在那个节点上运行,以及什么时候运行.Slave服务(Yarn NodeManager)运行在每个节点上,节点控制着Executor进程,同时监控作业的运行状态以及资源的消耗.Spark运行在Yarn上,有两种模式,Yarn-Client和Yarn-Cluster.通常情况下,

Hadoop之MapReduce的两种任务模式

MapReduce按照任务大小和设置的不同,提供了两种任务模式: 客户端通过org.apache.hadoop.mapreduce.protocol.ClientProtocol与服务端通信,ClientProtocol的继承关系: 老一些的版本还有一个JobTracker的实现类,即:classic.用于和MapReduce1.X兼容用的,高一些的版本已经没有这个实现类了. 一,本地模式(LocalJobRunner实现) mapreduce.framework.name设置为local,则不

JAVA学习篇--JAVA的两种编程模式对比

在Drp项目中,讲解了两种编程模式Model 1和Model2,下面是对这两种模式的简单理解,以及由于Model2是基于MVC架构的模式,就将我们易混淆的MVC与我们之前学的三层架构进行对比学习一下. Model1 所谓Model1就是JSP大行其道的时代,在Model1模式下,整个Web应用几乎全部由JSP页面组成,JSP页面接收处理客户端请求,对请求处理后直接做出响应.用少量的JavaBean来处理数据库连接.数据库访问等操作. 代码示例:修改用户信息主页面的js跳转: function

go--->共享内存和通信两种并发模式原理探究

共享内存和通信两种并发模式原理探究并发理解人类发明计算机编程的本质目的是为了什么呢?毫无疑问是为了解决人类社会中的各种负责业务场景问题.ok,有了这个出发点,那么想象一下,比如你既可以一心一意只做一件事,你也可以同时做多件事,比如,你计划今天上午计划就是看足球比赛,ok,你今天的工作就是串行的,单进程的,你只需要完成一件事.但是不巧呢,你妈妈说让你帮她切肉,你妈妈上午要出门有点事,同时不巧呢,你老婆说她上午也要出门,让你帮着打扫家里卫生,这时你今天就要同时做三件事,看比赛,切肉,打扫卫生.这

Apache 两种工作模式：prefork 、 worker

前言 1·最近这几篇文章都在讲Apache的一些安全与优化,这些针对服务器都是很重要的,掌握这些不仅提升了服务器的安全,还让服务器的性能大大的提高.这样就可以让客户有很好的体验感.2·今天这篇文章依旧是讲Apache.但是,是讲Apache的优化深入.Apache 的默认配置保证基本运行服务,但是在实际生产环境中,有时候需要把服务器性能发挥到最大化. Apache的两种工作模式:(prefork.worker) 很多朋友都知道Apache是当下Web服务器用得最广泛也是最稳定的开源软件之一,其中

猜你喜欢

获取百度地图POI数据一（详解百度返回的POI数据）

POI是一切可以抽象为空间点的现实世界的实体,比如餐馆,酒店,车站,停车场等.POI数据具有空间坐标和各种属性,是各种地图查询软件的基础数据之一.百度地图作为国内顶尖的地图企业,其上具有丰富的POI数 ...

java笔记4之比较运算符

/* 比较运算符: ==,!=,>,>=,<,<= 特点: 无论你的操作是简单还是复杂,结果是boolean类型. ...

2015.09.16

这两天没有学到什么新知识,之前一直在看理论,没怎么实践过,今天上午练习了一上午的金山打字,感觉有了那么一丁点的进步吧.以后按照课本系统的去学习,现在对c基本上有了一定的认识,也意识到了以后学习的困难, ...

JBoss vs. Tomcat

JBoss 支持Servlet.Web Server和其他J2EE Features Servlet引擎使用Tomcat的内核 SSL性能比Tomcat快4倍(据说) 支持.net.PHP.CGI 支 ...

Steve Lin:如何撰写一篇优秀的SIGGRAPH论文

原文:http://blog.sina.com.cn/s/blog_4caedc7a0102v6mu.html 一篇优秀的论文应该是这样的广大的研究同仁介绍了这篇论文所包含的重要想法和所获得的结果 ...

php 创建简单的Restful WebAPI（二）

先说一下这个项目的代码结构吧. 首先是index.php,我是把它作为中央控制器,一个调度器.程序通过rewrite或其他方式,把所有url导向本文件,由index.php调度其他代码. 然后rout ...

win10 右键发送到目录

C:\Users\llskj\AppData\Roaming\Microsoft\Windows\SendTo C:\Users\llskj\AppData\Roaming\Microsoft\Win ...

java相关的帖子

JVM调优的"标准参数"的各种陷阱:http://hllvm.group.iteye.com/group/topic/27945 Java Crash分析:http://www.s ...

mac composer 安装

在命令行执行 curl -sS https://getcomposer.org/installer | php 如果没安装 curl 执行以下代码 php -r "readfile('htt ...

sqlite C/C++ API

官网:https://sqlite.org/download.html 下载代码安装三步走: ./configure // ./configure --help查看安装参数设置,学习configure ...

相信很多朋友遇到过网站换服务器的问题，或成功或失败！今天3A网络小钱给大家讲的是自己的一个亲身经历，原先小钱有一个网站是在linux服务器上运行，所用的web服务为nginx+mysql+php，但由于服务器到期，新服务器用的是win2008系统，那就需要只能做好迁移！前期做的准备 1、必须了解自己网站所用的PHP和MySQL的版本 2、网站大小

相信很多朋友遇到过网站换服务器的问题,或成功或失败!今天3A网络小钱给大家讲的是自己的一个亲身经历,原先小钱有一个网站是在linux服务器上运行,所用的web服务为nginx+mysql+php,但由 ...

Git 学习（七）标签管理

Git 学习(七)标签管理发布版本时,通常会先在版本库中打一个标签,这样,就唯一确定了打标签时刻的版本.取出某个标签的版本,就是把那个打标签的时刻的历史版本取出来.所以,标签也是版本库的一个快照. ...

析构方法 deinit

/* 析构方法: 对象的内存被回收前被隐式调用的方法, 对应OC的dealloc方法主要执行一些额外操作, 例如释放一些持有资源, 关闭文件, 断开网络等 */ class FileHandle { ...

java 日期增加

1 import java.text.ParseException; 2 import java.text.SimpleDateFormat; 3 import java.util.Date; 4 5 ...

自己写的一个多应用程序多目录的Makefile

DIR_INC = ./includeDIR_SRC = ./srcDIR_OBJ = ./objDIR_BIN = ./binINCLUDES = -I${DIR_INC} -I.CC => ...

FL2440移植Linux2.6.33.7内核

kernel version:2.6.33.7 /linux-2.6.33.7 OS:CentOS 6.4 cross-compilation chain:arm-linux-4.3.2 /usr/l ...

闭包，定时器，循环

1.对于一个一般的循环,顺序输出01234 for(var i=0;i<5;i++){ console.log(i) } 2.如果加上定时器,实现每隔两秒出现一个数字 for(var i=0;i ...

linux系统之间复制文件

#scp -P22 /home/test.txt [email protected]:/home/ 本地文件test.txt 复制到远程服务器 #scp -P22 [email protected]: ...

C# 多态(通俗理解)

这里随便说说多态,看了上面继承再看看这篇. 多态:通过继承实现的不同对象调用相同的方法,表现出不同的行为. 之前的前台调用代码如下: 1 namespace ConsoleApplication7 2 ...

1.安装mysql server 2.安装MySql的VS插件(版本请下载最新版,百度自己搜索,这个不用多说)mysql-for-visualstudio-1.2.3.msi 3.安装用于.net连接 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.019 s.