执行”spark-shell –master yarn –deploy-mode client”,虚拟内存大小溢出，报错

在Hadoop 2.7.2集群下执行如下命令：

spark-shell --master yarn --deploy-mode client

爆出下面的错误：

org.apache.spark.SparkException: Yarn application has already ended! It might have been killed or unable to launch application master.

在Yarn WebUI上面查看启动的Cluster状态，log显示为：

Container [pid=28920,containerID=container_1389136889967_0001_01_000121] is running beyond virtual memory limits. Current
usage: 1.2 GB of 1 GB physical memory used; 2.2 GB of 2.1 GB virtual memory used. Killing container.

这是由于虚拟内存大小超过了设定的数值，可以修改配置，进行规避。

There is a check placed at Yarn level for Vertual and Physical memory usage ratio. Issue is not only that VM doesn‘t have sufficient pysical memory. But it is because Virtual memory usage is more than expected for given physical memory.

Note : This is happening on Centos/RHEL 6 due to its aggressive allocation of virtual memory.

It can be resolved either by :

Disable virtual memory usage check by setting yarn.nodemanager.vmem-check-enabled to false;
Increase VM:PM ratio by setting yarn.nodemanager.vmem-pmem-ratio to some higher value（default value is 2.1）.

Add following property in yarn-site.xml
<property>
<name>yarn.nodemanager.vmem-check-enabled</name>
<value>false</value>
<description>Whether virtual memory limits will be enforced for containers</description>
</property>
<property>
<name>yarn.nodemanager.vmem-pmem-ratio</name>
<value>4</value>
<description>Ratio between virtual memory to physical memory when setting memory limits for containers</description>
</property>

3.Then, restart yarn.

Reference:

http://blog.cloudera.com/blog/2014/04/apache-hadoop-yarn-avoiding-6-time-consuming-gotchas/

http://blog.chinaunix.net/uid-28311809-id-4383551.html

http://stackoverflow.com/questions/21005643/container-is-running-beyond-memory-limits

时间： 2025-01-08 11:02:32

执行”spark-shell –master yarn –deploy-mode client”,虚拟内存大小溢出，报错

执行”spark-shell –master yarn –deploy-mode client”,虚拟内存大小溢出，报错的相关文章

【原创 Hadoop&Spark 动手实践 5】Spark 基础入门，集群搭建以及Spark Shell

spark-shell启动报错：Yarn application has already ended! It might have been killed or unable to launch application master

忽然遇到报错：ERROR spark.SparkContext: Error initializing SparkContext.

[转帖]k8s集群node节点一直NotReady, 且node节点(并非master)的kubelet报错：Unable to update cni config: No networks found in /etc/cni/net.d

redhat6.4执行二进制程序报错：/lib/ld-linux.so.2: bad ELF interpreter: No such file or directory

学习Spring Cloud中eureka注册中心添加security认证，eureka client注册启动报错

Linux-006-执行Shell脚本报错 $'\r':command not found

Spark跑在Yarn上出现错误，原因是jdk的版本问题

Spark运行模式：cluster与client