SPARK 中 DriverMemory和ExecutorMemory

spark中，不论spark-shell还是spark-submit，都可以设置memory大小，但是有的同学会发现有两个memory可以设置。分别是driver memory 和executor memory。

从名字上大概可以猜出大概。具体就是说driver memory并不是master分配了多少内存，而是管理多少内存。换言之就是为当前应用分配了多少内存。

executor memory是每个节点上占用的内存。每一个节点可使用内存。

单独设置其中一个，集群仍能正常启动。

实际应用中，初步感觉executor memory受限于driver memory。当executor memory设置特别大，而driver memory默认时，应用可分配的内存依然很小，数据达到一定程度就会爆栈。故而当前一般先设置DM（driver memory），随后根据集群情况、任务大小等实际情况来设置EM（executor memory）。

而二者有什么关系，待随后有时间，查看spark源代码实现，进行分析。

二者分配的上限下限分别是什么，也需要随后实践来证明。在此留下一问，随后解决。

时间： 2024-10-21 20:47:23

SPARK 中 DriverMemory和ExecutorMemory的相关文章

初解，Scala语言中基于Actor的并发编程的机制，并展示了在Spark中基于Scala语言的Actor而产生的消息驱动框架Akka的使用,

Scala深入浅出实战中级--进阶经典(第66讲:Scala并发编程实战初体验及其在Spark源码中应用解析)内容介绍和视频链接 2015-07-24 DT大数据梦工厂从明天起,做一个勤奋的人看视频.下视频,分享视频 DT大数据梦工厂-Scala深入浅出实战中级--进阶经典:第66讲:Scala并发编程实战初体验及其在Spark源码中的应用解析本期视频通过代码实战详解了Java语言基于加锁的并发编程模型的弊端以及Scala语言中基于Actor的并发编程的机制,并展示了在Spark中基于Sc

spark中的广播变量broadcast

Spark中的Broadcast处理首先先来看一看broadcast的使用代码: val values = List[Int](1,2,3) val broadcastValues = sparkContext.broadcast(values) rdd.mapPartitions(iter => { broadcastValues.getValue.foreach(println) }) 在上面的代码中,首先生成了一个集合变量,把这个变量通过sparkContext的broadcast函数进

spark中的RDD以及DAG

今天,我们就先聊一下spark中的DAG以及RDD的相关的内容 1.DAG:有向无环图:有方向,无闭环,代表着数据的流向,这个DAG的边界则是Action方法的执行 2.如何将DAG切分stage,stage切分的依据:有宽依赖的时候要进行切分(shuffle的时候, 也就是数据有网络的传递的时候),则一个wordCount有两个stage, 一个是reduceByKey之前的,一个事reduceByKey之后的(图1), 则我们可以这样的理解,当我们要进行提交上游的数据的时候, 此时我们可以认

Spark中GraphX图运算pregel详解

由于本人文字表达能力不足,还是多多以代码形式表述,首先展示测试代码,然后解释: package com.txq.spark.test import org.apache.spark.graphx.util.GraphGeneratorsimport org.apache.spark.graphx._import org.apache.spark.rdd.RDDimport org.apache.spark.{SparkConf, SparkContext, SparkException, gra

Spark中的键值对操作-scala

1.PairRDD介绍 Spark为包含键值对类型的RDD提供了一些专有的操作.这些RDD被称为PairRDD.PairRDD提供了并行操作各个键或跨节点重新进行数据分组的操作接口.例如,PairRDD提供了reduceByKey()方法,可以分别规约每个键对应的数据,还有join()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD. 2.创建Pair RDD 程序示例:对一个英语单词组成的文本行,提取其中的第一个单词作为key,将整个句子作为value,建立 PairR

Spark 中 map 与 flatMap 的区别

通过一个实验来看Spark 中 map 与 flatMap 的区别. 步骤一:将测试数据放到hdfs上面 hadoopdfs -put data1/test1.txt /tmp/test1.txt 该测试数据有两行文本: 步骤二:在Spark中创建一个RDD来读取hdfs文件/tmp/test1.txt 步骤三:查看map函数的返回值得到map函数返回的RDD: 查看map函数的返回值--文件中的每一行数据返回了一个数组对象步骤四:查看flatMap函数的返回值得到flatMap函数返回的

为什么spark中只有ALS

WRMF is like the classic rock of implicit matrix factorization. It may not be the trendiest, but it will never go out of style --Ethan Rosenthal 前言 spark平台推出至今已经地带到2.1的版本了,很多地方都有了重要的更新,加入了很多新的东西.但是在协同过滤这一块却一直以来都只有ALS一种算法.同样是大规模计算平台,Hadoop中的机器学习算法库Mah

Scala 深入浅出实战经典第51讲：Scala中链式调用风格的实现代码实战及其在Spark中应用

王家林亲授<DT大数据梦工厂>大数据实战视频 Scala 深入浅出实战经典(1-64讲)完整视频.PPT.代码下载:百度云盘:http://pan.baidu.com/s/1c0noOt6 腾讯微云:http://url.cn/TnGbdC 360云盘:http://yunpan.cn/cQ4c2UALDjSKy 访问密码 45e2土豆:http://www.tudou.com/programs/view/5uuKOP38d6s/优酷:http://v.youku.com/v_show/id_

Scala 深入浅出实战经典第42讲：scala 泛型类,泛型函数,泛型在spark中的广泛应用

王家林亲授<DT大数据梦工厂>大数据实战视频 Scala 深入浅出实战经典(1-64讲)完整视频.PPT.代码下载:百度云盘:http://pan.baidu.com/s/1c0noOt6 腾讯微云:http://url.cn/TnGbdC 360云盘:http://yunpan.cn/cQ4c2UALDjSKy 访问密码 45e2 技术爱好者尤其是大数据爱好者可以加DT大数据梦工厂的qq群 DT大数据梦工厂① :462923555 DT大数据梦工厂②:437123764 DT大数据梦工厂③

猜你喜欢

星际转移（cogs 736）

?问题描述: 由于人类对自然资源的消耗,人们意识到大约在2300 年之后,地球就不能再居住了.于是在月球上建立了新的绿地,以便在需要时移民.令人意想不到的是,2177 年冬由于未知的原因,地球环境发生 ...

最小费用流spfa算法模板（pascal）

以前写过,现在的码风与以前有些变化,主要是用数组模拟邻接表存图,以前是用指针存图. 以前的博文:http://www.cnblogs.com/Currier/p/6387732.html 洛谷可评测. ...

OpenCV人脸检测

由于光照.遮挡和倾斜等原因,部分人脸和眼睛并不能正确检测.. // 简单的人脸检测 #include <iostream> #include <vector> #include ...

08 - 图形上下文状态栈

*:first-child { margin-top: 0 !important; } body > *:last-child { margin-bottom: 0 !important; } ...

余弦定理实现新闻自动分类算法

前言余弦定理,这个在初中课本中就出现过的公式,恐怕没有人不知道的吧.但是另外一个概念,可能不是很多的人会听说过,他叫空间向量,一般用e表示,高中课本中有专门讲过这个东西,有了余弦定理和向量空间,我们 ...

Hadoop离线项目介绍

Hadoop离线项目介绍(不包括程序) 一:项目场景 1.需求分析根据用户行为数据进行程序的处理,得到结果保存到关系型数据库中需要收集用户(系统使用者)在不同客户端上产生的用户行为数据,最终保存到 ...

程序员的坚持

在程序员这个行业中流行着“一入IT似海深”.“钱多话少死的早”等等玩笑的段子,但仔细想想也不无道理,这也是侧面反映了这个行业的一些负面的影响.在互联网快速崛起的时代,我们每个人都想去分一杯羹,都想去踏 ...

Machine Learning - IX. Neural Networks Learning (Week 5)

http://blog.csdn.net/pipisorry/article/details/44119187 机器学习Machine Learning - Andrew NG courses学习笔记 ...

rsync+sersync实现数据时时备份

CentOS6.6中rsync+sersync实现数据实时备份注意:rsync的daemon模式已提前配置好了,只需要配置sersync即可 . 一.基本环境系统版本主机名 IP地址角色备份 ...

如何使用跨平台工具创建 NuGet 包（转）

原文地址 https://docs.microsoft.com/zh-cn/dotnet/articles/core/deploying/creating-nuget-packages 内容对于 . ...

IBM P系列小型机HMC默认IP地址

IBM小型机通过HMC管理和维护特别的方便和便捷,但是很多情况下,我们不知道后端HMC的管理IP地址. 现将小型机上HMC默认的IP地址记录如下: P5及更旧的机型默认地址为: HMC 0:192.1 ...

angularJS1笔记-(8)-内置指令

index.html: <!DOCTYPE html> <html lang="en"> <head> <meta charset=&qu ...

4.python的迭代器与生成器

一.什么玩意是迭代器? 先说说什么是迭代吧,迭代就是一件事情重复很多次,比如说for循环. for循环可以对一切有__iter__方法的对象进行迭代,那么什么是__iter__方法呢? 一个对象是否可 ...

基本数据类型的包装类和随机数

/** * * 包装类/封装类: 把基本数据类型转换成对象! * 每一个基本数据类型都有一个对应的包装类!都是位于java.lang包中! * 作用: 提供我们操作的一系列方法! * 例子:集合中能存 ...

从前有座山，山里有座庙

来自知乎:https://www.zhihu.com/question/36242099 著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处.作者:兔尾巴老李链接:https://ww ...

DELL磁盘阵列控制卡（RAID卡）MegaCli常用管理命令汇总

新版本的 MegaCli-1.01.24-0.i386.rpm (下载地址:http://www.lsi.com/downloads/Public/MegaRAID Common Files/8.02 ...

jquery tmpl 详解(转)

动态请求数据来更新页面是现在非常常用的方法,比如博客评论的分页动态加载,微博的滚动加载和定时请求加载等. 这些情况下,动态请求返回的数据一般不是已拼好的 HTML 就是 JSON 或 XML,总之不在 ...

13 三种方式替换SQL Server中的NULL值(Different ways to replace NULL in Sql Server)

在Sql Server中有三种方式对查询结果中的NULL值进行替换. 如有下面的一张表: 我们可以通过自连接(Self-Join)的方式一张员工名和其对应的经理名的表: SELECT E.[Name] ...

知道真相的我眼泪掉下来，良心程序员！

java程序员的良心表现原文来自:techfox IT 技术论坛点击阅读

在centos6.x和centos7.x环境下停机扩容docker的pool空间

一.首先介绍一下docker的存储驱动Device Mapper插件的工作原理如果在CentOS .REHL .Fedor或者其他默认没有 AUFS支持的Linux发行版上使用Docker,你需要用 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.038 s.