摘要:MapReduce程序开发流程遵循算法思路、Mapper、Reducer、作业执行的步骤。
关键词:MapReduce 程序 开发流程
对于一个数据处理问题,若需要MapReduce,那么如何设计和实现?MapReduce程序基础模板,包含两个部分,一个是map,一个是reduce。map和reduce的设计取决解决问题的算法思路;而map和reduce的执行需要作业的调度。
因此,MapReduce程序开发可以遵循以下流程。
第一步:清楚问题是什么,确定解决问题的算法思路。
第二步:设计和实现mapreduce程序中的Mapper。
第三步:设计和实现mapreduce程序中的Reducer。
第四步:设置作业调度。
mapreduce程序与很多编程有所不同,它是一种函数型编程,完全地展现了“分而治之”的哲学思想,是分布式系统下一种强有力的处理工具。
因而,用户编写mapreduce程序时,一方面要具备mapreduce程序思想;另一方面要符合mapreduce程序开发流程。同时,通过多写mapreduce程序,掌握并熟悉这种编程模型。
Resource:
1 http://www.wangluqing.com/2014/03/hadoop-mapreduce-develop-flow/
Hadoop之MapReduce程序开发流程
时间: 2024-10-12 03:30:33