Hadoop中shuffle阶段流程分析

MapReduce longteng 9个月前 (12-23) 399浏览 0评论

宏观上，Hadoop每个作业要经历两个阶段：Map phase和reduce phase。对于Map phase，又主要包含四个子阶段：从磁盘上读数据-》执行map函数-》combine结果-》将结果写到本地磁盘上；对于reduce phase，同样包含四个子阶段：从各个map task上读相应的数据（shuffle）-》sort-》执行reduce函数-》将结果写到HDFS中。

（注：本文介绍的shuffle阶段非常粗略，如果想了解shuffle实现细节以及当前主流的优化方法，可阅读我的最新书籍《Hadoop技术内幕：深入解析MapReduce架构设计与实现原理》（购买说明）第8章 “Task运行过程分析”以及第8.5.2节 “系统优化”）

Hadoop处理流程中的两个子阶段严重降低了其性能。第一个是map阶段产生的中间结果要写到磁盘上，这样做的主要目的是提高系统的可靠性，但代价是降低了系统的性能，实际上，Hadoop的改进版–MapReduce Online去除了这个阶段，而采用其他更高效的方式提高系统可靠性（见参考资料[1]）；另一个是shuffle阶段采用HTTP协议从各个map task上远程拷贝结果，这种设计思路（远程拷贝，协议采用http）同样降低了系统性能。实际上，Baidu公司正试图将该部分代码替换成C++代码来提高性能（见参考资料[2]）。

本文首先着重分析shuffle阶段的具体流程，然后分析了其低效的原因，最后给出了可能的改进方法。

如图所示，每个reduce task都会有一个后台进程GetMapCompletionEvents，它获取heartbeat中（从JobTracker）传过来的已经完成的task列表，并将与该reduce task对应的数据位置信息保存到mapLocations中，mapLocations中的数据位置信息经过滤和去重（相同的位置信息因为某种原因，可能发过来多次）等处理后保存到集合scheduledCopies中，然后由几个拷贝线程（默认为5个）通过HTTP并行的拷贝数据，同时线程InMemFSMergeThread和LocalFSMerger会对拷贝过来的数据进行归并排序。

主要有两个方面影响shuffle阶段的性能：（1）数据完全是远程拷贝（2）采用HTTP协议进行数据传输。对于第一个方面，如果采用某种策略（修改框架），让你reduce task也能有locality就好了；对于第二个方面，用新的更快的数据传输协议替换HTTP，也许能更快些, 如UDT协议（见参考资料[3]），它在MapReduce的另一个C++开源实现Sector/Sphere（见参考资料[4]）中被使用，效果不错！

学习转载，原文链接：http://blog.csdn.net/lihm0_1/article/details/17026251

时间： 2024-10-11 05:24:19

Hadoop中shuffle阶段流程分析

Hadoop中shuffle阶段流程分析

Hadoop中shuffle阶段流程分析的相关文章

Android中View绘制流程分析

newlib 中的 crt0 流程分析

MySQL中的SQL流程分析简述

Hadoop的Shuffle阶段

MSM8909中LK阶段LCM屏适配与显示流程分析

Hadoop中的Shuffle 与 Spark中的Shuffle得区别与联系

Hadoop中MapReduce多种join实现实例分析

Hadoop RPC通信Server端的流程分析

Fescar(Seata)-Springcloud流程分析-2阶段