spark 读取mongodb失败,报executor time out 和GC overhead limit exceeded 异常

代码：

import com.mongodb.spark.config.ReadConfig
import com.mongodb.spark.sql._
val config = sqlContext.sparkContext.getConf
.set("spark.mongodb.keep_alive_ms", "15000")
.set("spark.mongodb.input.uri", "mongodb://10.100.12.14:27017")
.set("spark.mongodb.input.database", "bi")
.set("spark.mongodb.input.collection", "userGroupMapping")
val readConfig = ReadConfig(config)
val objUserGroupMapping = sqlContext.read
.format("com.mongodb.spark.sql")
.mongo(readConfig)
objUserGroupMapping.printSchema()
val tbUserGroupMapping=objUserGroupMapping.toDF()
tbUserGroupMapping.registerTempTable("userGroupMapping")

select _id,c,g,n,rn,t,ut from userGroupMapping where ut>‘2018-05-02‘ limit 100

使用上述的代码取userGroupMapping 集合过后的100条记录，出现了executor time out 和GC overhead limit exceeded 异常。一开始以为推测是task 从mongodb取的数据太大，导致spark executor内存不够，后来调研了一下spark mongodb connector 在取数据的时候是条件下发的，也就是先从mongodb过滤再取回spark 内存，这样的话就不会出现内存不够的情况。后来在网上调研后，有一种说法是说task 太多，导致task gc的时候争夺gc时间和内存资源（这个不是很清楚），根据这种说法，我把本来task core 从16个调成6个后再跑程序，居然不会报错了。至于具体原因还不是很清楚，先在这里记录一下。

原文地址：https://www.cnblogs.com/chengjunhao/p/8984466.html

时间： 2024-11-08 19:17:15

spark 读取mongodb失败,报executor time out 和GC overhead limit exceeded 异常的相关文章

Android Studio编译报错“java.lang.OutOfMemoryError: GC overhead limit exceeded

1.在build.gradle添加脚本指定编译堆内存如果在整个工程中生效,则在build.gradle中增加如下配置: android { .............. dexOptions { incremental true javaMaxHeapSize "4g" } ............... } 如果只在单元测试的时候生效,则在build.gradle中增加如下配置: android { .............. testOptions {

Spark 1.4.1中Beeline使用的gc overhead limit exceeded

最近使用SparkSQL做数据的打平操作,就是把多个表的数据经过关联操作导入到一个表中,这样数据查询的过程中就不需要在多个表中查询了,在数据量大的情况下,这样大大提高了查询效率. 我启动了thriftserver,然后通过beeline去连接thriftserver, 打平操作进行的很顺利,但是在执行groupby操作的时候beeline报了一个错误:gc overhead limit exceeded 我分析可能是thriftserver报的错误.但是查看了thriftserver的日志没有任

spark出现GC overhead limit exceeded和java heap space

spark执行任务时出现java.lang.OutOfMemoryError: GC overhead limit exceeded和java.lang.OutOfMemoryError: java heap space 最直接的解决方式就是在spark-env.sh中将下面两个参数调节的尽量大 export SPARK_EXECUTOR_MEMORY=6000M export SPARK_DRIVER_MEMORY=7000M 注意,此两个参数设置需要注意大小顺序: SPARK_EXEC

Spark OOM：java heap space，OOM:GC overhead limit exceeded解决方法

问题描述: 在使用spark过程中,有时会因为数据增大,而出现下面两种错误: java.lang.OutOfMemoryError: Java heap space java.lang.OutOfMemoryError:GC overhead limit exceeded 这两种错误之前我一直认为是executor的内存给的不够,但是仔细分析发现其实并不是executor内存给的不足,而是driver的内存给的不足.在standalone client模式下用spark-submit提交任务时(

IDEA报错：GC overhead limit exceeded？

1. 问题描述在运行代码之后,出现以下错误: Exception in thread "main" org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 107.0 failed 1 times, most recent failure: Lost task 0.0 in stage 107.0 (TID 208, localhost, executor driver):

JVM运行报错：GC overhead limit exceeded

今天在折腾OOM和java的4种引用类型的时候,在运行过程中JVM报了一个错误: java.lang.OutOfMemoryError: GC overhead limit exceeded 这个错误平时遇到的概率很少很少,今天无意中遇到了,这里做个记录.oracle/sun官网的解释是: The concurrent collector will throw an OutOfMemoryError if too much time is being spent in garbage colle

eclipse一直报An internal error occurred during: "Building workspace". GC overhead limit exceeded

最近导入到eclipse里的工程挺大的,每次eclipse启动之后都回update workspace,然后就一直报: An internal error occurred during: "Building workspace". GC overhead limit exceeded 这个错误. 解决方法: 原因是Eclipse默认配置内存太小需要更改Eclipse安装文件夹下的eclipse.ini文件. Eclipse.ini默认文件如下: 修改如下: -Xms512m -Xmx

Eclipse报错：gc overhead limit exceeded eclipse

原因是Eclipse默认配置内存太小需要更改Eclipse安装文件夹下的eclipse.ini文件. 1.打开eclipse配置文件找到eclipse 执行文件上右键-显示包内容-Contents-MacOS-eclipse.ini 修改如下: -Xms512m -Xmx1024m 第一个是最小的初始化内存,第二个是最大的占有内存还可以加上 -XX:MaxPermSize=1024m这个意思是在编译文件时一直占有最大内存,重启Eclipse

Eclipse启动报错：An internal error occurred during: "Building workspace". GC overhead limit exceeded

今天启动Eclipse时发现右下角的building workspce走到2%时,不动了,Eclipse好长时间没反应,然后弹出错误信息:An internal error occurred during: "Building workspace". GC overhead limit exceeded. 如下图: 上网搜了一下,说是要修改一下Eclipse安装下的eclipse.ini文件,增加Eclipse实例的内存分配,.打开eclipse.ini文件,内容如下: [html]

猜你喜欢

209. Minimum Size Subarray Sum

https://leetcode.com/problems/minimum-size-subarray-sum/#/description Given an array of n positive i ...

bootstrap iCheck插件全选和获取value值的解决方法

在使用jQuery iCheck 插件的时候遇到了一个问题,就是当我们使用普通的js全选功能无效了. $("#checkall").click( function(){ ...

windows系统中常用的快捷键

开发中,一些常用的键盘技巧: (1)快速切换桌面(alt+tab)或者是(window+tab) (2)迅速关闭当前页面 (3)迅速收起所有页面 (4)直接回到桌面页面 (5)锁定你的屏幕

【MySQL】MySQL统计NULL字段处理

select A.user_id,ifnull(sum(ifnull(A.ex_cpu,0)),0) AS a0, ifnull(sum(ifnull(A.ex_mem,0)),0) AS a1, i ...

【Objective-C】09-空指针和野指针

一.什么是空指针和野指针 1.空指针 1> 没有存储不论什么内存地址的指针就称为空指针(NULL指针) 2> 空指针就是被赋值为0的指针.在没有被详细初始化之前.其值为0. 以下两个都是空 ...

【版本控制】Git起步

1. Git命令行 ? ~ git usage: git [--version] [--help] [-C <path>] [-c name=value] [--exec-path[=&l ...

hdu 2444判定二分图+最大匹配

两连发板子题,水果留恋 #include<stdio.h> #include<string.h> #include<algorithm> using namespa ...

SpringMVC表单中post请求转换为put或delete请求

1.在web.xml文件中配置 1  2 <filt ...

C语言之回文数算法

"回文"是指正读反读都能读通的句子.它是古今中外都有的一种修辞方式和文字游戏,如"我为人人,人人为我"等.在数学中也有这样一类数字有这种特征,成为回文数(pal ...

函数（形参/实参）

函数是带名字的代码块,用于完成具体的工作要执行函数定义的特定任务,可调用该函数. 什么时候使用函数: 当在程序中需要多次使用同一功能的时候,为了简化代码,可以把这个功能定义到函数. 定义一个 ...

CUDA_进行图像特征匹配V2.0

在V1.0的基础上改变了排序方式并对部分并行代码进行了优化 #include "cuda_runtime.h"#include "device_launch_parame ...

Android之高仿雅虎天气(二)---代码结构解析

版本已升级至1.0.1 源码地址: GitHub:https://github.com/way1989/WayHoo OsChina:http://git.oschina.net/way/WayHoo ...

chfn是用来改变你的finger讯息

finger 总览 finger[-lmsp][user...][user host...][[]] 参数: -s Finger显示用户的登录名,真名,终端名以及写状态(如果写被禁止,在终端名后显示一 ...

Glup的安装与使用

Glup的安装与使用少量代码示例: 前提:需下载配置Node.js环境在本地文件夹下载插件:npm install 插件名 --save-dev var gulp = require(" ...

JSON字符串和JSON对像相互转化

将json字符串转换为json对象的方法.在数据传输过程中,json是以文本,即字符串的形式传递的,而JS操作的是JSON对象,所以,JSON对象和JSON字符串之间的相互转换是关键例如: JSON ...

android中的textview显示汉字不能自动换行的一个解决办法

<TableLayout xmlns:android="http://schemas.android.com/apk/res/android" android:layout_ ...

【C语言】用宏实现一个整形奇偶位交换

//用宏实现一个整形奇偶位交换 //例如6为0000..0110,交换完为0000..1001,即为9 #include <stdio.h> #define EXCHANGE(num) ( ...

网站平台架构演变史（三） - 数据库表的查询优化

上篇说道了数据库读写分离,对于大型网站来说这么说是十分有必要的.数据库在整个互联网架构中担当的角色无法有两个,存储和运算,很多时候这两个是并存的,但是在后期,对于上亿条数据来说,让数据库既要存储,又要 ...

Delphi Math单元函数

这个单元包含高性能的算术.三角.对数.统计和金融方面的计算及FPU程序函数用于补充Delphi语言System.pas 单元中的数学常规程序函数注意1) 对于有些函数,这个单元中涉及的概念或常数由Ea ...

相邻数字相加为质数

题意: A ring is composed of n (even number) circles as shown in diagram. Put natural numbers into eac ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 11 q. 0.019 s.