yarn环境跑mapreduce报错某个container 600s未报告进度超时被杀

问题:

发现每次reduce阶段跑到98%,相关的container被杀,报出的log大概的意思:container 600s未报告进度超时被杀

解决办法:

在mapreduce程序里加上

conf.set("mapred.task.timeout", "0");                        //不检查超时

重新打包运行,最后没有出现错误,但是运行很长时间,总算运行完了,怀疑程序问题有大循环

最后检查reduce发现会有双层循环,有可能会非常大,导致卡在reduce内部,长时间没有进行任何的读写,也就没有汇报他的进度情况

总结

问题的原因起于对于悬挂的task,如果NMr在一段时间(默认是10min,可以通过mapred.task.timeout属性值来设置,单位是毫秒)内一直没有收到它的进度报告,则把它标记为失效

时间: 2024-10-06 16:01:13

yarn环境跑mapreduce报错某个container 600s未报告进度超时被杀的相关文章

Hadoop2.2简单上传文件,web环境下启动报错,求大神

String home = "hdfs://192.168.0.212:8020/";String src = "/root/桌面/111.jpg";String dst = "/6.jpg";InputStream in = new BufferedInputStream(new FileInputStream(src));Configuration conf = new Configuration();FileSystem fs = File

小程序报错:出现脚本错误或者未正确调用 Page()的解决办法

场景是两个人共同开发小程序,我使用的是pc端,另一个同事是用的mac端,我这边能够正常运行项目,代码提交到git,同事check下来发现运行报错: 出现脚本错误或者未正确调用 Page(); 如图 一脸懵逼,在这里也吐槽一下开发工具,报这种错误你让我去哪找问题,感觉就是老虎吃天无从下口,上网搜索全是让我在每个index.js下面加上Page({})这个字段,但是现在微信开发工具已经会默认在每个页面的js文件里面加上Page({})的好吗,几番搜索无果后遂放弃挣扎, 也不知道是不是平时有烧高香的习

解决Oracle+Mybatis批量插入报错:SQL 命令未正确结束

Mybatis批量插入需要foreach元素.foreach元素有以下主要属性: (1)item:集合中每一个元素进行迭代时的别名. (2)index:指定一个名字,用于表示在迭代过程中,每次迭代到的位置. (3)collection:根据传入的参数值确定. (4)open:表示该语句以什么开始. (5)separator:表示在每次进行迭代之间以什么符号作为分隔 符. (6)close:表示以什么结束. 首先,错误的xml配置文件如下: <insert id="save" da

关于URLRewriter报错:System.NullReferenceException: 未将对象引用设置到对象的实例 的解决

检查网站日期,发现内容如下:System.NullReferenceException: 未将对象引用设置到对象的实例. 在 URLRewriter.ModuleRewriter.Rewrite(String requestedPath, HttpApplication app) 在 URLRewriter.BaseModuleRewriter.BaseModuleRewriter_AuthorizeRequest(Object sender, EventArgs e) 在 System.Web

原!tomcat启动超时(打印了几行日志,后面没了。也不报错,处于启动状态,直到超时)

项目框架:spring+struts2+mybatis 今天优化代码,改了一堆mybatis dao和xml文件,启动项目时,就出现如标题描述的状况:打印了几行日志,后面就不打印了,也不报错,处于启动状态,直到超时. 首先检查是不是tomcat有问题,发现tomcat没有问题,后来感觉应该是项目代码问题,百度了一圈,发现也有碰到这种问题的  在mybatis的Mapper配置文件里配置了两个同名的ID,但是它们参数不同,结果就出现了部署时tomcat启动不了,改了启动时间也不行. 后来看了dao

oracle 两个sql带有order by的使用union/union all的时候报错 &#39;ORA-00933:sql命令未正确结束&#39; 处理办法

错误语句:select id,name from s1 order by stime union all select id,name from s2 order by stime 报错原因:oracle 搜索到order by后认为整个select语句就该结束了但是后面还有union all所以数据库无法解析,导致报错 处理办法:with a1 as (select id,name from s1 order by stime) , a2 as (select id,name from s2

cordova-ios 升级到4.4.0 无法真机跑iOS8 报错: dyld`dyld_fatal_error: -&gt; 0x120085088 &lt;+0&gt;: brk #0x3

项目进入测试阶段,马上要上线了,同事拿了自己的iOS8系统5s跑真机,无缘无故报错,之前跑她的手机完全没有问题的.Xcode 8.x中最低部署版本是iOS8.0,按理说完全能够跑真机的. 但是报了一个很让人头痛的错误:dyld`dyld_fatal_error: -> 0x120085088 <+0>: brk #0x3,考虑到APP的实际运行环境可能还有iOS8,这个问题必须解决,Stack Overflow上csdn,cnblog逛了一大圈. 纠结了好久,下面链接有个算全面的解决方法

spark运行任务报错:Container [...] is running beyond physical memory limits. Current usage: 3.0 GB of 3 GB physical memory used; 5.0 GB of 6.3 GB virtual memory used. Killing container.

spark版本:1.6.0 scala版本:2.10 报错日志: Application application_1562341921664_2123 failed 2 times due to AM Container for appattempt_1562341921664_2123_000002 exited with exitCode: -104 For more detailed output, check the application tracking page: http://w

LAMP(1)--环境搭建及报错解决

环境:CentOS 6.5 ★安装mysql cd /usr/local/src wget http://syslab.comsenz.com/downlo ... -icc-glibc23.tar.gz tar zxvf /usr/local/src/mysql-5.1.40-linux-i686-icc-glibc23.tar.gz  解压 mv mysql-5.1.40-linux-i686-icc-glibc23 /usr/local/mysql  useradd -s /sbin/no