spark 相关配置 shuffle 相关配置选项

在master的/conf/spark-defaults.conf中配置

spark.shuffle.service.enabled true

spark.shuffle.service.port 7337

但是在从节点的spark-defaults.conf中注释上面两个配置选项,不然web 界面中将看不到从节点

spark-defaults.conf:

spark.local.dir /mnt/diskb/sparklocal,/mnt/diskc/sparklocal,/mnt/diskd/sparklocal,/mnt/diske/sparklocal,/mnt/diskf/sparklocal,/mnt/diskg/sparklocal //shuffle 中产生的临时文件的路径
spark.eventLog.enabled true                               //记录spark日志
spark.eventLog.dir hdfs://nameservice1/spark-log  //日志保存在hdfs上
spark.network.timeout 450

spark.dynamicAllocation.enabled true

spark.dynamicAllocation.minExecutors 8

spark.dynamicAllocation.maxExecutors 30
spark.dynamicAllocation.schedulerBacklogTimeout 1s
spark.dynamicAllocation.sustainedSchedulerBacklogTimeout 5s

spark.io.compression.codec snappy

spark-env.sh:

export JAVA_HOME=/usr/java/jdk1.7.0_67-cloudera
export SPARK_MASTER_IP=10.130.2.20
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=12
export SPARK_EXECUTOR_INSTANCES=1
export SPARK_WORKER_MEMORY=48g
export SPARK_WORKER_DIR=/mnt/diskb/sparkwork,/mnt/diskc/sparkwork,/mnt/diskd/sparkwork,/mnt/diske/sparkwork,/mnt/diskf/sparkwork,/mnt/diskg/sparkwork
export SPARK_LOCAL_DIRS=/mnt/diske/sparklocal,/mnt/diskb/sparklocal,/mnt/diskc/sparklocal,/mnt/diskd/sparklocal,/mnt/diskf/sparklocal,/mnt/diskg/sparklocal
export HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop
export HADOOP_CONF_DIR=/etc/hadoop/conf/
export SPARK_DAEMON_MEMORY=12g
#export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=bdc40.hexun.com:2181,bdc41.hexun.com:2181,bdc46.hexun.com:2181,bdc53.hexun.com:2181,bdc54.hexun.com:2181 -Dspark.deploy.zookeeper.dir=/spark"
#export SPARK_DAEMON_JAVA_OPTS="-Dspark.deploy.recoveryMode=FILESYSTEM -Dspark.deploy.recoveryDirectory=/opt/modules/spark/recovery"
export JAVA_LIBRARY_PATH=$JAVA_LIBRARY_PATH:$HADOOP_HOME/lib/native
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HADOOP_HOME/lib/native
export SPARK_LIBRARY_PATH=$SPARK_LIBRARY_PATH:$HADOOP_HOME/lib/native
export SPARK_CLASSPATH=$SPARK_CLASSPATH:$HADOOP_HOME/lib/snappy-java-1.0.4.1.jar

时间: 2024-10-20 15:55:28

spark 相关配置 shuffle 相关配置选项的相关文章

EF Code First 配置的相关内容

I.实体间一对一的关系 添加一个PersonPhoto类,表示用户照片类 1 /// <summary> 2 /// 用户照片类 3 /// </summary> 4 public class PersonPhoto 5 { 6 [Key] 7 public int PersonId { get ; set ; } 8 public byte [] Photo { get ; set ; } 9 public string Caption { get ; set ; } // 标题

Java的cmd配置(也即Java的JDK配置及相关常用命令)——找不到或无法加载主类 的解决方法

Java的cmd配置(也即Java的JDK配置及相关常用命令) ——找不到或无法加载主类  的解决方法 这段时间一直纠结于cmd下Java无法编译运行的问题.主要问题描述如下: javac 命令可以正常运行,而java命令有时可以正常运行,有时却不可以,不可以的症状就是显示“找不到或无法加载主类”. 在网上找了各种资料,最终发现是因为代码里含有package语句,所以无法在cmd下运行java命令解释.class文件.而那些可以运行的文件就是因为没有使用package语句. 我这种问题的解决方法

有关rip路由协议相关知识以及实例配置【第一部分】

有关rip路由协议相关知识以及实例配置[第一部分] RIP呢,这是一个比较重要的知识点,所以它的知识覆盖面很广泛:但是呢,我将会对碰到的问题进行一些分析解刨(主要是为了帮助自己理清思维):也希望能够从中发现自己不足的问题,也希望能够找到一些比较冷僻的问题,这样子才会有意思多了.   先上图,这个就是我准备做实验的基本用图了.现在已经按照图上标注的IP将所有基本配置设置好了. 在这个实验中,大多数都是基于ripv1,只有在需要比较的时候才会把版本改成ripv2,然后判断完之后再切换为ripv1:

OSPF相关知识与实例配置

OSPF相关知识与实例配置[基本知识及多区域配置] OSPF(开放式最短路径优先协议)是一个基于链路状态的IGP,相比于RIP有无环路:收敛快:扩展性好等优点,也是现在用的最多的:所以这次实验就针对于OSPF(HCNA)内容进行一个探究: 在说ospf配置前:我们先来了解下ospf LSA的类型: type1 LSA:每个ospf路由器都会产生type1 LSA:描述了对应设备接口的物理接口所连接的链路或接口,并且表明了个链路的状态.开销等参数:(只在区域内泛洪) Type2 LSA:网络LSA

使用Nginx+uwsgi在亚马逊云服务器上部署python+django项目完整版(二)——部署配置及相关知识

一.前提: 1.django项目文件已放置在云服务器上,配置好运行环境,可正常运行 2.云服务器可正常连接 二.相关知识 1.python manage.py runserver:这是一款适合开发阶段使用的服务器,不能对大量请求进行同时处理,不适合运行在真实的生产环境中,在实际生产环境中使用WSGI作为接口,连接web和python代码(也就是django项目): 2.WSGI:Web服务器网关接口,英文为Python Web Server Gateway Interface,缩写为WSGI,是

深度学习 Annconda虚拟环境配置及相关问题解决

今天由于装了高版本的显卡驱动,把机器搞瘫痪了,然后又一顿瞎操作把情况搞的更糟,然后从7点办搞到2点,又被朱帜帆抢救回来了.并且,更重要的是,把环境配置的相关操作又梳理了下,对各个相关的东西又有了清晰一些的了解了.    总结一下,首先是他移动来移动去硬盘分区,把开机只闪动下划线的问题搞好了(毅力惊人),能进入登陆界面了,然后ctrl+alt+f1,然后卸载高版本驱动,装回384版本驱动,可以重新开机,故障修复完成.然后是教我使用anaconda虚拟环境,这个虚拟环境相当于一个虚拟机,所有东西都在

使用H3C模拟器配置VLAN相关项目

任务1 组网需求:如 图1-1 所示,小区用户Host A.Host B.Host C分别与Device的端口GigabitEthernet 1/0/1.GigabitEthernet 1/0/2 .GigabitEthernet 1/0/3 相连, Device 设备通过GigabitEthernet 1/0/4 端口与外部网络相连.现需要实现小区用户Host A.Host B和Host C彼此之间二层报文不能互通,但可以和外部网络通信.试验拓扑图如下: 配置步骤:创建隔离组2.<Device

使用HCL模拟器配置DHCP相关项目

试验1:使用DHCP协议自动给PC机分配IP地址.试验拓扑图如下:使用路由器作为DHCP服务器实验配置如下:(1) # 配置接口的 IP 地址.<H3C> system-view[H3C] interface g 0/0[[H3C-GigabitEthernet0/0]] ip address 192.168.1.254 24[[H3C-GigabitEthernet0/0]] quit(2)# 启用 DHCP 服务.[H3C] dhcp enable(3) # 配置不参与自动分配的 IP 地

使用HCL模拟器配置OSPF相关项目

任务一: 组网需求所有的交换机都运行 OSPF,并将整个自治系统划分为 3 个区域.其中 Switch A 和 Switch B 作为 ABR 来转发区域之间的路由.配置完成后,每台交换机都应学到 AS 内的到所有网段的路由.实验拓扑图如下: 实验配置如下: 配置步骤(1) 配置各接口的 IP 地址(略)例SwitchB:<H3C>sys[H3C]hostname SwitchB[SwitchB]vlan 100[SwitchB-vlan100]port g 1/0/10[SwitchB-vl