MapReduce程序运行模式

本地运行模式：

mapreduce程序是被提交给LocalJobRunner在本地以单进程的形式运行
而处理的数据及输出结果可以在本地文件系统，也可以在hdfs上
怎样实现本地运行？写一个程序，不要带集群的配置文件
本质是程序的conf中是否有mapreduce.framework.name=local以及yarn.resourcemanager.hostname参数
本地模式非常便于进行业务逻辑的debug，只要在eclipse中打断点即可

集群运行模式：

将mapreduce程序提交给yarn集群，分发到很多的节点上并发执行
处理的数据和输出结果应该位于hdfs文件系统
提交集群的实现步骤：

将程序打成JAR包，然后在集群的任意一个节点上用hadoop命令启动
hadoop jar
wordcount.jar cn.itcast.bigdata.mrsimple.WordCountDriver args

总结：

mapreduce的运行模式

概念：所谓的运行模式指的是由谁给mr程序提供运算时候所需要的硬件资源
两种模式：
- 集群模式：程序计算的资源由yarn分配分布式计算的效果生产环境线上环境的模型
- 本地模式：程序计算的资源由程序所在的机器本地系统模拟出单机计算的效果开发测试环境
- 决定什么模式运行
- mapreduce.framework.name = local 本地模式
  mapreduce.framework.name = yarn 集群模式
  
  2
  
  2
  
  1
```
mapreduce.framework.name  = local  本地模式
```
  2
```
mapreduce.framework.name  = yarn   集群模式
```
```
如果不配置 默认是local模式 但是要注意该集群的环境中是否配置了hadoop 如果有覆盖默认的识别出mared-site.xml中配置
```
- 注意事项
  
  要想本地运行mr程序需要解决hadoop native library问题 winutils.exe 程序

原文地址：https://www.cnblogs.com/TiePiHeTao/p/d755b31c288ab18e07ac963b0cec87eb.html

时间： 2024-12-15 18:19:10

MapReduce程序运行模式的相关文章

Mapreduce程序运行的多模式

Mapreduce程序可在多种模式下运行: 本地模式: 1) 本地文件,本地处理:将MR的输入输出路径设置为本地路径: 2) 集群文件,本地处理:将MR的输入输出设置为HDFS的路径,job在本地进行处理; 2.集群模式:集群文件,集群处理:将MR的输入输出设置为HDFS的路径,并将Job提交到集群里面(Yarn)处理:其中以集群模式运行的时候还可通过以下几种方式对Job作业进行提交(前提是在集群里面已经启动HDFS以及Yarn): 1) 在Ecl

MapReduce 程序运行报错 java.lang.ClassNotFoundException解决方法

在创建自定义的Mapper时候,编译正确,但上传到集群执行时出现错误: 11/16/05 22:53:16 INFO mapred.JobClient: Task Id : attempt_201111301626_0015_m_000000_0, Status : FAILED java.lang.RuntimeException: java.lang.ClassNotFoundException: actiondemo.MyJob$MapClass at org.apache.Hadoop.

如何在maven项目里面编写mapreduce程序以及一个maven项目里面管理多个mapreduce程序

我们平时创建普通的mapreduce项目,在遍代码当你需要导包使用一些工具类的时候, 你需要自己找到对应的架包,再导进项目里面其实这样做非常不方便,我建议我们还是用maven项目来得方便多了话不多说了,我们就开始吧首先你在eclipse里把你本地安装的maven导进来选择你本地安装的maven路径勾选中你添加进来的maven 把本地安装的maven的setting文件添加进来接下来创建一个maven项目可以看到一个maven项目创建成功!! 现在我们来配置pom.xml文件,把map

在Hadoop上运行基于RMM中文分词算法的MapReduce程序

原文:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-count-on-hadoop/ 在Hadoop上运行基于RMM中文分词算法的MapReduce程序 23条回复我知道这个文章标题很“学术”化,很俗,让人看起来是一篇很牛B或者很装逼的论文!其实不然,只是一份普通的实验报告,同时本文也不对RMM中文分词算法进行研究.这个实验报告是我做高性能计算课程的实验里提交的.所以,下面的内容是从我的实验报告里摘录出来的,当作是我学

MR程序Debug调式或者运行模式

问题描述:在开发MR程序中会遇一些问题需要通过Debug调式,那么本文将介绍描述配置eclipse如何在Windows或者Linux下启动Debug调式. MR程序的Debug调式换言之就是MR程序的运行模式,MR程序有三种运行模式:本地模式(local).集群模式(cluster) Linux环境下: 1.本地模式:直接通过eclipse右键进行Debug即可 2.集群模式: 2.1.将hadoop的配置文件:core-site.xml/hdfs-site.xml/mapreduce-site

Win7下面安装hadoop2.x插件及Win7/Linux运行MapReduce程序

一.win7下 (一).安装环境及安装包 win7 32 bit jdk7 eclipse-java-juno-SR2-win32.zip hadoop-2.2.0.tar.gz hadoop-eclipse-plugin-2.2.0.jar hadoop-common-2.2.0-bin.rar (二).安装默认已经安装好了jdk.eclipse以及配置好了hadoop伪分布模式 1.拷贝hadoop-eclipse-plugin-2.2.0.jar插件到Eclipse安装目录的子目录plu

Hadoop-MR[会用]MR程序的运行模式

1.简介现在很少用到使用MR计算框架来实现功能,通常的做法是使用hive等工具辅助完成.但是对于其底层MR的原理还是有必要做一些了解. 2.MR客户端程序实现套路这一小节总结归纳编写mr客户端程序的一般流程和套路.将以wordcount为例子进行理解. 运行一个mr程序有三种模式,分别为:本地模式,本地集群模式,命令行集群模式 3.代码实现 import java.io.IOException; import org.apache.hadoop.conf.Configuration; imp

3 weekend110的job提交的逻辑及YARN框架的技术机制 + MR程序的几种提交运行模式

途径1: 途径2: 途径3: 成功! 由此,可以好好比较下,途径1和途径2 和途径3 的区别. 现在,来玩玩weekend110的joba提交的逻辑之源码跟踪原来如此,weekend110的job提交的逻辑源码,停在这了 hello world hello tom helllo jim jim is a bad boy hello jack hello baby baby is my nvshen hello world hello tom helllo jim jim is a bad bo

使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0

使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0 网上的 MapReduce WordCount 教程对于如何编译 WordCount.java 几乎是一笔带过… 而有写到的,大多又是 0.20 等旧版本版本的做法,即 javac -classpath /usr/local/hadoop/hadoop-1.0.1/hadoop-core-1.0.1.jar WordCount.java,但较新的 2.X 版本中,已经没有 hadoop-core*.jar 这个文件,因此