Mapreduce程序运行的多模式

Mapreduce程序可在多种模式下运行:

  1. 本地模式:

1)         本地文件,本地处理:将MR的输入输出路径设置为本地路径;

2)         集群文件,本地处理:将MR的输入输出设置为HDFS的路径,job在本地进行处理;

  2.集群模式:集群文件,集群处理:将MR的输入输出设置为HDFS的路径,并将Job提交到集群里面(Yarn)处理;其中以集群模式运行的时候还可通过以下几种方式对Job作业进行提交(前提是在集群里面已经启动HDFS以及Yarn):

1)         在Eclipse提交:

a)         在安装有hadoop相应版本的eclipse开发Mapreduce程序的hadoop插件,在运行时可直接右键选择run in Hadoop

b)         若未安装插件,可在Mapreduce项目下导入hadoop里面配置好的配置文件Mapreduce-site.xml,yarn-site.xml同时在程序入口处用Configuration指明配置:

conf.set(“mapreduce.job.jar”,”xxx.jar”),若不想导入这两个文件则需多加几个配置语句conf.set(“mapreduce.framework.name”,”yarn”)···等等配置文件里面的配置项。

2)         通过命令行提交:在eclipse下打成jar包之后丢进集群环境:hadoop jar xxx.jar xxxx(打jar前的主类,需写明所在包和类) 【需设参数的话此处可设置参数】

时间: 2024-10-18 05:47:18

Mapreduce程序运行的多模式的相关文章

MapReduce程序运行模式

本地运行模式: mapreduce程序是被提交给LocalJobRunner在本地以单进程的形式运行 而处理的数据及输出结果可以在本地文件系统,也可以在hdfs上 怎样实现本地运行?写一个程序,不要带集群的配置文件 本质是程序的conf中是否有mapreduce.framework.name=local以及yarn.resourcemanager.hostname参数 本地模式非常便于进行业务逻辑的debug,只要在eclipse中打断点即可 集群运行模式: 将mapreduce程序提交给yar

MapReduce 程序运行报错 java.lang.ClassNotFoundException解决方法

在创建自定义的Mapper时候,编译正确,但上传到集群执行时出现错误: 11/16/05 22:53:16 INFO mapred.JobClient: Task Id : attempt_201111301626_0015_m_000000_0, Status : FAILED java.lang.RuntimeException: java.lang.ClassNotFoundException: actiondemo.MyJob$MapClass at org.apache.Hadoop.

Net Core基于TopShelf程序运行于服务模式

原文地址:https://www.cnblogs.com/JerryMouseLi/p/11537372.html

如何在maven项目里面编写mapreduce程序以及一个maven项目里面管理多个mapreduce程序

我们平时创建普通的mapreduce项目,在遍代码当你需要导包使用一些工具类的时候, 你需要自己找到对应的架包,再导进项目里面其实这样做非常不方便,我建议我们还是用maven项目来得方便多了 话不多说了,我们就开始吧 首先你在eclipse里把你本地安装的maven导进来 选择你本地安装的maven路径 勾选中你添加进来的maven 把本地安装的maven的setting文件添加进来 接下来创建一个maven项目 可以看到一个maven项目创建成功!! 现在我们来配置pom.xml文件,把map

在Hadoop上运行基于RMM中文分词算法的MapReduce程序

原文:http://xiaoxia.org/2011/12/18/map-reduce-program-of-rmm-word-count-on-hadoop/ 在Hadoop上运行基于RMM中文分词算法的MapReduce程序 23条回复 我知道这个文章标题很“学术”化,很俗,让人看起来是一篇很牛B或者很装逼的论文!其实不然,只是一份普通的实验报告,同时本文也不对RMM中文分词算法进行研究.这个实验报告是我做高性能计算课程的实验里提交的.所以,下面的内容是从我的实验报告里摘录出来的,当作是我学

Win7下面安装hadoop2.x插件及Win7/Linux运行MapReduce程序

一.win7下 (一).安装环境及安装包 win7 32 bit jdk7 eclipse-java-juno-SR2-win32.zip hadoop-2.2.0.tar.gz hadoop-eclipse-plugin-2.2.0.jar hadoop-common-2.2.0-bin.rar (二).安装 默认已经安装好了jdk.eclipse以及配置好了hadoop伪分布模式 1.拷贝hadoop-eclipse-plugin-2.2.0.jar插件到Eclipse安装目录的子目录plu

使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0

使用命令行编译打包运行自己的MapReduce程序 Hadoop2.6.0 网上的 MapReduce WordCount 教程对于如何编译 WordCount.java 几乎是一笔带过… 而有写到的,大多又是 0.20 等旧版本版本的做法,即 javac -classpath /usr/local/hadoop/hadoop-1.0.1/hadoop-core-1.0.1.jar WordCount.java,但较新的 2.X 版本中,已经没有 hadoop-core*.jar 这个文件,因此

使用Eclipse运行Hadoop 2.x MapReduce程序常见问题

1. 当我们编写好MapReduce程序,点击Run on Hadoop的时候,Eclipse控制台输出如下内容: 这个信息告诉我们没有找到log4j.properties文件.如果没有这个文件,程序运行出错的时候,就没有打印日志,因此我们会很难调试. 解决方法:复制$HADOOP_HOME/etc/hadoop/目录下的log4j.properties文件到MapReduce项目 src文件夹下. 2.当执行MapReduce程序的时候,Eclipse可能会报告堆益处的错误. 此时,MapRe

Win7下Eclipse中运行远程MapReduce程序

1.hadoop插件的参数配置 2.运行时的参数 3.运行结果 Win7下Eclipse中运行远程MapReduce程序,布布扣,bubuko.com