mapreduce出现类似死锁情况

1. mapreduce.job.reduce.slowstart.completedmaps:

在往hbase表里通过bulkload导数据时，某个mapreduce跑了一个多小时还没跑，看yarn界面，发现map还有一小部分没跑完，没跑完的map全在pending，running中没有，同时reduce在copy阶段把资源全用光，导致map没资源去跑，进而导致reduce一直在copy

状态等待。也就是说map需要资源去跑，reduce需要等map全部跑完才能进行下一个阶段，这样就导致相互等待，类似死锁。大约在一个半小时左右，有130多个reduce被AppMaster kill，被kill的reduce出现日志：Reducer preempted to make room for pending

map attempts Container killed by the ApplicationMaster. Container killed on request. Exit code is 143 Container exited with a non-zero exit code 143。这就是说当资源不够是，AppMaster会kill掉reduce释放资源给map。

解决办法是:

调整mapreduce.job.reduce.slowstart.completedmaps参数，默认为0.05，即map完成0.05后reduce就开始copy，如果集群资源不够，有可能导致reduce把资源全抢光，可以把这个参数调整到0.8，map完成80%后才开始reduce copy。

时间： 2024-10-10 23:16:52

mapreduce出现类似死锁情况的相关文章

java多线程中死锁情况的一个示例

下面是死锁情况的一个示例代码 package com.qust.demo.money; class A { public synchronized void foo(B b) { System.out.println(Thread.currentThread().getName() + " 进入A的foo"); try { Thread.sleep(200); } catch (InterruptedException ex) { ex.printStackTrace(); } Sys

查看数据库里阻塞和死锁情况

/*********************************** //删除死锁存储过程 ***************************************/ if exists (select * from dbo.sysobjects where id = object_id(N'[dbo].[sp_who_lock]') and OBJECTPROPERTY(id, N'IsProcedure') = 1) drop procedure [dbo].[sp_who_l

信号处理函数误用不可重入函数导致的进程死锁情况

记一次进程死锁的情况: 某天突然发现进程不再运行处理且有没有崩溃产生core文件: 使用gdb -p pid查看堆栈信息如下: 1 #0 0x000000376faf83ae in __lll_lock_wait_private () from /lib64/libc.so.6 2 #1 0x000000376fa7d35b in _L_lock_10288 () from /lib64/libc.so.6 3 #2 0x000000376fa7ab83 in malloc () from /l

线程死锁情况和while在线程的作用

public class printDemo04 { public static void main(String[] args) { Resource01 resource01 = new Resource01(); Producer producer = new Producer(resource01); Producers producers = new Producers(resource01); Thread thread0 = new Thread(producer); Thread

Python中死锁的形成示例及死锁情况的防止

死锁示例搞多线程的经常会遇到死锁的问题,学习操作系统的时候会讲到死锁相关的东西,我们用Python直观的演示一下.死锁的一个原因是互斥锁.假设银行系统中,用户a试图转账100块给用户b,与此同时用户b试图转账200块给用户a,则可能产生死锁.2个线程互相等待对方的锁,互相占用着资源不释放. #coding=utf-8 import time import threading class Account: def __init__(self, _id, balance, lock): self.i

Oracle数据表中的死锁情况解决方法

不知道干了啥,把数据表锁住了,没法update. 百度了各种方法,总结如下. 查看被锁住的表(两句都可以): select * from v$session t1, v$locked_object t2 where t1.sid=t2.SESSION_ID select sess.sid, sess.serial#, lo.oracle_username, lo.os_user_name, ao.object_name, lo.locked_mode from v$locked_object

sql server 死锁情况处理

select request_session_id spid,OBJECT_NAME(resource_associated_entity_id) tableName from sys.dm_tran_locks where resource_type='OBJECT' declare @spid int Set @spid = 1663 --锁表进程declare @sql varchar(1000)set @sql='kill '+cast(@spid as varchar)exec(@sq

SQL死锁情况汇总排查

select dbname,entity_name,count(1) as locks from (SELECT request_session_id AS spid, DB_NAME(resource_database_id) AS dbname, CASE WHEN resource_type='object' THEN OBJECT_NAME(resource_associated_entity_id) WHEN resource_associated_entity_id=0 THEN '

sql server中高并发情况下同时执行select和update语句死锁问题（一）

最近在项目上线使用过程中使用SqlServer的时候发现在高并发情况下,频繁更新和频繁查询引发死锁.通常我们知道如果两个事务同时对一个表进行插入或修改数据,会发生在请求对表的X锁时,已经被对方持有了.由于得不到锁,后面的Commit无法执行,这样双方开始死锁.但是select语句和update语句同时执行,怎么会发生死锁呢?看完下面的分析,你会明白的- 首先看到代码中使用的查询的方法Select <span style="font-size:18px;"> /// &

猜你喜欢

javascript全局方法

1.encodeURI(URI) a.作用:是对统一资源标识符(URI)进行编码的方法: b.参数:是一个完整的URI: c.特点:不需要对保留字以及在URI中有特殊意思的字符进行编码. (1).保留 ...

微信内置浏览器，判断ready事件

最近做的一个微站,在微信中打开时,用zepto取高度会随机地出现错误.判断是ready事件有问题,用下面的代码可以解决: if(WeixinApi.openInWeixin()){ if (typeo ...

C#中的if if...和if-else if

编写多个if和编写多谢if-esle if结果是不一样的,下面以实例说明: 一.多个if-else if: 1 static void Main(string[] args) 2 { 3 int a ...

[主机/oracle/msyql] 监控脚本

为了方便自己测试和监控,写了三个监控的脚本. 分别监控: 主机[cpu,mem,disk,fs,net] oracle mysql 脚本如下: hmon.py: monitor Linux os sy ...

CentOs install oracle instant client

rpm -ivh oracle-instantclient11.2-basic-11.2.0.3.0-1.x86_64.rpm rpm -ivh oracle-instantclient11.2-de ...

如何在cluster上跑R脚本

R 是一个比较不错但是有时候操蛋的语言,不错是因为用着爽的时候真的很爽,操蛋是因为这种爽不是什么时候都可以的,比如说在cluster上批处理跑R脚本. 当然说这话有些在上面跑过的各种不服气,你丫傻逼吧 ...

HDU 4035 期望dp

这道题站在每个位置上都会有三种状态死亡回到起点:k[i] 找到出口结束 e[i] 原地不动 p[i] k[i]+e[i]+p[i] =1; 因为只给了n-1条路把所有都连接在一起,那么我们可以自然的 ...

【BZOJ1671】[Usaco2005 Dec]Knights of Ni 骑士 BFS

[Usaco2005 Dec]Knights of Ni 骑士 Description 贝茜遇到了一件很麻烦的事:她无意中闯入了森林里的一座城堡,如果她想回家,就必须穿过这片由骑士们守护着的森林．为了 ...

ThinkPhp学习07

原文:ThinkPhp学习07 简单CRUD操作 1 public function show() { 2 $m=M('User'); 3 4 // $arr=$m->find(2); //查找 ...

撩峭哺烧毓80籽祷燎hz烫浩

宣布孩子招才得七个原则:一不用胡子长短衡量人得能力;二不以资历深浅未录用得依据;三不把文凭视未水平;四不再党与非党上设卡;五不以档案看人;六不因犯过错误而把人看死;七不以有争议而弃之不用. 就职演说 ...

iOS UIPopoverController的使用

1. 什么是UIPopoverController? 是iPad开发中常见的一种控制器(在iphone上不允许使用) 跟其他控制器不一样的是,它直接继承自NSObject,并非继承自UIViewCon ...

lintcode-medium-Simplify Path

Given an absolute path for a file (Unix-style), simplify it. Example "/home/", => " ...

面向AWS云服务的Web应用架构

高可用和可扩展的web应用是复杂而昂贵的.密集的高峰时段和流量模式的剧烈波动导致昂贵的硬件利用率低下.Amazon 云服务为web 应用提供高可靠的,可扩展的,安全的高性能基础设施,同时保证了弹性,根 ...

必应壁纸php获取接口

<?php if($_GET['idx']==null){ $str=file_get_contents('http://cn.bing.com/HPImageArchive.aspx?idx= ...

Android使用百度定位SDK 方法及错误处理

之前我的项目中的位置定位使用的是基站方法,使用的Google提供的API,但是前天中午突然就不返回数据了,到网上搜了一下才知道,Google的接口不提供服务了,基于时间紧迫用了百度现有的SDK,但是 ...

OS X系统各种命令整理20161018

一.如何开启apache 在终端输入apachectl -k start 二.OS X如何打开活动监控器然后直接拖到dock中三.查看端口号被占用的情况 1.在终端中输入lsof -i tcp:p ...

Q1:划分服务的原则是什么

判断良好服务的标准服务自身保持高内聚(有自己独立的领域模型) 封装内部变化,通过API对外暴露功能(只有本服务自身的代码可访问本领域模型的数据库,其他系统只能通过本服务暴露的API间接访问本服务的数 ...

编译安装php-amq扩展

用途:这个扩展是用来操作rabbitmq服务端的一.安装总括 1.编译安装librabbitmq库这是一个开源c语言的库.用来与rabbitmq进行通信而php的php-amqp扩展就是使用这个 ...

深入分析面向对象中的对象概念

OOP:面向对象编程,一提到面向对象,大家可能就想到类,接口.一说特性,大家可能张口就来:继承.封装.多态,那么到底什么样的对象(类)才是真正意义上的对象呢?特别是现在流行的DDD领域驱动设计思想,讲 ...

谈谈静默安装

来问静默安装的朋友很多,并且大部分情况下,对静默安装的概念和原理不清楚,所以还是写个小文章,普及一下知识.首先明确一下静默安装的概念,静默安装指的是安装时无需任何用户干预,直接按默认设置安装.那么问题 ...

专题

随机推荐

© 2024 憋错料 | info#biecuoliao.com | 10 q. 0.021 s.