spark-OutOfMemory:GC overhead limit exceeded 解决

今天准备跑自己的spark程序，但是运行过程中遇到了OutOfMemory:GC overhead limit exceeded的错误。

原以为是数据集太大，google了一番，以为是内存不够了，但是在webui一看其实数据集好像也不是很大，但是还是尝试提高了内存配置，通过提高spark.executor.memory和spark.shuffle.memoryFraction，降低spark.storage.memoryFraction，来提高机器可用的堆空间。

再次运行发现，问题依旧。在苦恼中找到Spark User Mailing List的一个问答帖，有人和我遇到了同样的问题。在帖子里发现了一个新的解释：executor core数量太多，导致了多个core之间争夺gc时间以及资源（应该主要是内存资源），最后导致大部分的时间都花在了gc上。

根据他的建议，我把core数量从4调到了1（也是挺极端的，真是为了成功运行，我拼了），方法是：由于我是spark standalone集群模式，所以直接编辑conf/spark-env.sh中的SPARK_EXECUTOR_CORES

运行，成功了。

真是不可思议，本来并行是为了提高速度和效率，但是这里却反而导致了运行失败。具体原因其实还不清楚，关于jvm的gc我也不甚了解，甚至也是今天我才尝试设置spark的其他环境参数，还是要多加学习啊！

时间： 2024-10-09 09:42:19

spark-OutOfMemory:GC overhead limit exceeded 解决的相关文章

GC overhead limit exceeded解决

java.lang.OutOfMemoryError: GC overhead limit exceeded解决一.异常如下:Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded 二.解释:JDK6新增错误类型.当GC为释放很小空间占用大量时间时抛出.一般是因为堆太小.导致异常的原因:没有足够的内存. 三.解决方案: 1.查看系统是否有使用大内存的代码或死循环.2.可以添加J

Spark OOM：java heap space，OOM:GC overhead limit exceeded解决方法

问题描述: 在使用spark过程中,有时会因为数据增大,而出现下面两种错误: java.lang.OutOfMemoryError: Java heap space java.lang.OutOfMemoryError:GC overhead limit exceeded 这两种错误之前我一直认为是executor的内存给的不够,但是仔细分析发现其实并不是executor内存给的不足,而是driver的内存给的不足.在standalone client模式下用spark-submit提交任务时(

spark出现GC overhead limit exceeded和java heap space

spark执行任务时出现java.lang.OutOfMemoryError: GC overhead limit exceeded和java.lang.OutOfMemoryError: java heap space 最直接的解决方式就是在spark-env.sh中将下面两个参数调节的尽量大 export SPARK_EXECUTOR_MEMORY=6000M export SPARK_DRIVER_MEMORY=7000M 注意,此两个参数设置需要注意大小顺序: SPARK_EXEC

java.lang.OutOfMemoryError: GC overhead limit exceeded解决

异常表现 Exception in thread “main” java.lang.OutOfMemoryError: GC overhead limit exceeded 异常原因 JDK6新增错误类型.当GC为释放很小空间占用大量时间时抛出. 一般是因为堆太小.导致异常的原因:没有足够的内存. 解决方法 1.查看系统是否有使用大内存的代码或死循环. 2.可以添加JVM的启动参数来限制使用内存:-XX:-UseGCOverheadLimit

java 异常 java.lang.OutOfMemoryError: GC overhead limit exceeded 解决

一.异常如下: Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded 二.解释: JDK6新增错误类型.当GC为释放很小空间占用大量时间时抛出. 一般是因为堆太小.导致异常的原因:没有足够的内存. 三.解决方案: 1.查看系统是否有使用大内存的代码或死循环. 2.可以添加JVM的启动参数来限制使用内存:-XX:-UseGCOverheadLimit cnblogs - 问题处理

oozie： GC overhead limit exceeded 解决方法

1.异常表现形式 1) 提示信息 Error java.lang.OutOfMemoryError: GC overhead limit exceeded 2)提示出错 Error: Java heap space 问题产生原因: "if too much time is being spent in garbage collection: if more than 98% of the total time is spent in garbage collection and less th

eclipse   Unable to execute dex: GC overhead limit exceeded GC overhead limit exceeded解决办法

有个老APP在eclipse上,以前打包都很顺利,今天好几次就是打不出来包,总是报错,而且eclipse还经常未响应,非常恶心这软件. 后来仔细看了下英文报错内容,大概意思是:无法执行dex,GC空间不足,超额网上查了些资料找到了解决办法,需要对eclipse做相关配置,增加空间,如下: 1.关闭Eclipse 打开D:\eclipse\eclipse.ini -startup plugins/org.eclipse.equinox.launcher_1.3.0.v20120522-1813.

Unable to execute dex: GC overhead limit exceeded

Android打包时下面的错误: Unable to execute dex: GC overhead limit exceeded GC overhead limit exceeded 解决的方法: 1.关闭Eclipse 打开D:\eclipse\eclipse.ini -startup plugins/org.eclipse.equinox.launcher_1.3.0.v20120522-1813.jar --launcher.library plugins/org.eclipse.eq

Spark 1.4.1中Beeline使用的gc overhead limit exceeded

最近使用SparkSQL做数据的打平操作,就是把多个表的数据经过关联操作导入到一个表中,这样数据查询的过程中就不需要在多个表中查询了,在数据量大的情况下,这样大大提高了查询效率. 我启动了thriftserver,然后通过beeline去连接thriftserver, 打平操作进行的很顺利,但是在执行groupby操作的时候beeline报了一个错误:gc overhead limit exceeded 我分析可能是thriftserver报的错误.但是查看了thriftserver的日志没有任

猜你喜欢

Core Java 简单谈谈HashSet

同学们在看这个问题的时候,我先提出者两个问题,然后大家带着问题看这个文章会理解的更好. HashSet为什么添加元素时不能添加重复元素? HashSet是否添加null元素? 打开源码, 我们看到如下 ...

墨卡托投影坐标系（Mercator Projection）原理及实现C代码

墨卡托投影是一种"等角正切圆柱投影",荷兰地图学家墨卡托(Mercator)在1569年拟定:假设地球被围在一个中空的圆柱里,其赤道与圆柱相接触,然后再假想地球中心有一盏灯,把球面 ...

POI操作文档内容

一. POI简介 Apache POI是Apache软件基金会的开放源码函式库,POI提供API给Java程序对Microsoft Office格式档案读和写的功能. 二. HSSF概况 HSSF 是 ...

Oracle执行计划详解

简介: 本文全面详细介绍oracle执行计划的相关的概念,访问数据的存取方法,表之间的连接等内容. 并有总结和概述,便于理解与记忆! +++ 目录 --- 一．相关的概念 Rowid的概念 Re ...

（四）SQL入门数据库的操作与事务管理

数据库的操作,有三个最基本的语句,insert插入,update修改,delete删除. 不同的数据库厂商的实现可能不同,所以就不说具体的语法怎么写的了.说语法也没有意义,到处都可以复制粘贴,记得听某 ...

sql主页(常用命令)

视频资料地址:E:\baiduyunpan\黑马28期Android全套视频无加密完整版\01.JavaWEB\day09 视频资料地址二:F:\50期\day14 SQL ============= ...

centos7安装mysql5.6

1.更新yum源 wget http://repo.mysql.com/mysql-community-release-el7-5.noarch.rpm rpm -ivh mysql-communit ...

applicationContext-mail.xml 模板

<?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.sp ...

BZOJ 1486 最小圈（二分+判负环）

题目链接:http://61.187.179.132/JudgeOnline/problem.php?id=1486 题意:给出一个有向图,边有权值.找到一个环,使得环上边的权值之和除以环上边的个数最 ...

学会了彼此珍惜，相亲相爱

从上初一那年起,我就拒绝喊她姐,虽然她比我大两岁,可她刚上完五年级就辍学了.所以,自视比她强大的我和她说话的口气便有了颐指气使的味道. 高一时,我迷上了做饭.那天,康楠说她想吃炸肉丸,我举着本菜谱边研 ...

Linux mips64r2 PCI中断路由机制分析

Linux mips64r2 PCI中断路由机制分析本文主要分析mips64r2 PCI设备中断路由原理和irq号分配实现方法,并尝试回答如下问题: PCI设备驱动中断注册(request_irq) ...

不出五十年清朝必亡——曾国藩和心腹幕僚赵烈文秘谈录

来源:南方周末 1867年六月,赵烈文在与曾国藩谈话时预言:不出50年,清朝必亡.44年后,清朝果然土崩瓦解,接踵而来的混乱局面,也为赵烈文所言中:“必先根本颠仆,而后方州无主,人自为政.”从现存的文 ...

Linux - quota的举例说明

实作 Quota 流程-1:文件系统支持 [[email protected] ~]# df -h /home Filesystem Size Used Avail Use% Mounted on / ...

获取当前日期和农历的js代码

来自:http://www.cnblogs.com/Gnepner/archive/2011/09/07/2169822.html 获取当前日期 getToday.js: function GetCu ...

第一个简单的android项目

开发平台:windows7+Eclipse+andriod SDK(24.0)+ADT(23.0.4).这个环境的搭建在前一篇文章(Mobile testing下的appium测试)里面已经描述了. ...

场景管理

场景管理模块需要同时考虑前台和后台 1.对于副本来说,服务器在副本第一次被进入的时候,启动副本进程,所有进入此副本的角色,都会由这个副本进程管理,服务器端只有一份场景寻路数据,人和人之间关闭阻挡,但是 ...

veta 原型

http://www.nowamagic.net/librarys/veda/cate/PHP/2

Spring自定义标签

一.原理: 1.Spring通过XML解析程序将其解析为DOM树, 2.通过NamespaceHandler指定对应的Namespace的BeanDefinitionParser将其转换成BeanDe ...

mvc json 日期问题的最简单解决方法

1.首先编写BaseController这个类,需要引入Newtonsoft.Json.dll程序集 using System;using System.Collections.Generic;usi ...

servelet 直接输出内容

package helloworld; import java.io.IOException; import javax.servlet.ServletException; import javax. ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.