Hadoop-Yarn安装部署

Hadoop
Yarn的安装部署于Hadoop类似，以下以CDH4.5为例说明安装步骤。

三台机器，修改/etc/hosts及/etc/sysconfig/network中的HOSTNAME：

172.20.4.142 yarn-namenode

172.20.4.143 yarn-datanode1

172.20.4.147 yarn-datanode2

1、实现无密码namenode ssh to datanode

namenode上执行 ssh-keygen -t rsa -P ‘‘产生id_rsa.pub

cat id_rsa.pub > authorized_keys

scp authorized_keys yarn-datanode1:~/.ssh/

scp authorized_keys yarn-datanode2?:~/.ssh/

2、官网下载hadoop CDH4.5 解压至~/platform/hadoop

3、copy安装目录下的 etc/hadoop中文件至HADOOP_CONF_DIR下订制自己的hadoop配置

hadoop-env.sh中可配置$JAVA_HOME, $HADOOP_LOG_DIR, $HADOOP_PID_DIR

yarn-env.sh中可配置$YARN_CONF_DIR, $YARN_LOG_DIR

配置core-site.xml，主要是fs.defaultFS,指定namenode:

<name>fs.defaultFS</name>

<value>hdfs://yarn-namenode:8020</value>

</property>

配置hdfs-site.xml中namenode和datanode存储数据的目录：

<name>dfs.namenode.name.dir</name>

<value>/home/jjt/hard_disk/0,/home/pplive/hard_disk/1</value>

</property>

<name>dfs.datanode.data.dir</name>

</property>

配置mapred-site.xml,可不用配mapred.job.tracker?

<name>mapreduce.framework.name</name>

</property>

<name>mapred.local.dir</name>

<value>/home/jjt/hard_disk/0/mrtmp,/home/jjt/hard_disk/1/mrtmp</value>

</property>

配置yarn-site.xml:

<name>yarn.resourcemanager.webapp.address</name>

<value>yarn-namenode:8088</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce.shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.nodemanager.local-dirs</name>

</property>

配置slaves文件：

yarn-datanode1

yarn-datanode2

4、修改集群中/etc/profile保证集群中配置的环境变量相同，从namenode上scp $HADOOP_HOME $HADOOP_CONF_DIR 到所有其他机器

5、执行 hadoop namenode -format格式化，start-all.sh启动集群，或分开执行start-dfs.sh start-yarn.sh,使用jps可查看各节点启动的进程

6、修改本机hosts文件，可通过WEBUI yarn-namenode:8088?查看任务执行状态

7、提交测试job执行mapreduce，查看任务是否运行成功，如果出错可提升log4j级别通过log查看具体出差原因。

时间： 2024-12-20 13:51:19

Hadoop-Yarn安装部署的相关文章

Hadoop Yarn 安装

环境:Linux, 8G 内存,60G 硬盘 , Hadoop 2.2.0 为了构建基于Yarn体系的Spark集群,先要安装Hadoop集群,为了以后查阅方便记录了我本次安装的具体步骤. 事前准备 1. 机器准备三台主机,#后面说明了用途 192.168.1.1 #hadoop1 : master 192.168.1.2 #hadoop2 : datanode1 192.168.1.3 #hadoop3: datanode2 在hadoop1上, vi /etc/sysconf

Hadoop YARN 安装-单机伪分布式环境

本文是根据Hadoop官网安装教程写的Hadoop YARN在单机伪分布式环境下的安装报告,仅供参考. 1. 安装环境如下: 操作系统:Ubuntu14.04 Hadoop版本:hadoop-2.5.0 Java版本:openjdk-1.7.0_55 2. 下载Hadoop-2.5.0,下载地址 http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.5.0/hadoop-2.5.0.tar.gz 本文的$HADOOP_HOME为:/home/

hadoop分布式安装部署具体视频教程(网盘附配好环境的CentOS虚拟机文件/hadoop配置文件)

參考资源下载:http://pan.baidu.com/s/1ntwUij3视频安装教程:hadoop安装.flvVirtualBox虚拟机:hadoop.part1-part5.rarhadoop文件:hadoop-2.2.0.tar.gzhadoop配置文件:hadoop_conf.tar.gzhadoop学习教程:炼数成金-hadoop 虚拟机下载安装:VirtualBox-4.3.12-93733-Win.exehttp://dlc.sun.com.edgesuite.net/virtu

yarn安装部署

在HDFS HA(http://www.cnblogs.com/yinchengzhe/p/5140117.html)基础上进行yarn的安装. 1.配置yarn-site.xml 参数详情参考 http://www.cnblogs.com/yinchengzhe/p/5142659.html 配置如下: 2.配置mapred-site.xml 在${HADOOP_HOME}/etc/hadoop/下,将mapred-site.xml.templat重命名成mapred-site.xml 配置如

spark2.10安装部署（集成hadoop2.7+）

这里默认你的hadoop是已经安装好的,master是node1,slaver是node2-3,hdfs启动在node1,yarn启动在node2,如果没安装好hadoop可以看我前面的文章因为这里是spark和hadoop集成,我已经预先启动好了hdfs 和 yarn:MapReduce History Server也是需要启动的,详情往下看 Spark安装包:概述类别与Hadoop打包在一起的安装包 ? 比如:spark-2.1.0-bin-hadoop2.7.tgz,spark版本为

hadoop入门（3）——hadoop2.0理论基础：安装部署方法

一.hadoop2.0安装部署流程 1.自动安装部署:Ambari.Minos(小米).Cloudera Manager(收费) 2.使用RPM包安装部署:Apache hadoop不支持.HDP与CDH提供 3.使用jar包安装部署:各版本均提供.(初期为了理解hadoop,建议使用这种方式) 部署流程: 准备硬件(Linux操作系统) 准备软件安装包,并安装基础软件

Apache Hadoop集群离线安装部署(三)——Hbase安装

Apache Hadoop集群离线安装部署(一)--Hadoop(HDFS.YARN.MR)安装:http://www.cnblogs.com/pojishou/p/6366542.html Apache Hadoop集群离线安装部署(二)--Spark-2.1.0 on Yarn安装:http://www.cnblogs.com/pojishou/p/6366570.html Apache Hadoop集群离线安装部署(三)--Hbase安装:http://www.cnblogs.com/po

hadoop 2.x HA(QJM)安装部署规划

一.主机服务规划: db01 db02 db03 db04 db05 namenode namenode jo

一、Hadoop 2.x 分布式安装部署

一.Hadoop 2.x 分布式安装部署 1.分布式部署hadoop 2.x 1.1克隆虚拟机并完成相关配置 1.1.1克隆虚拟机点击原有虚拟机–>管理–>克隆–>下一步–>创建完成克隆–>写入名称hadoop-senior02–>选择目录 1.1.2配置修改 1)启动克隆虚拟机(内存配置:01:2G;02:1.5G;03:1.5G) 2)修改主机名:改两处 3)修改网卡名称编辑 /etc/udev/rules.d/70-persistent-net.rules -

Hadoop分布式HA的安装部署

[toc] Hadoop分布式HA的安装部署前言单机版的Hadoop环境只有一个namenode,一般namenode出现问题,整个系统也就无法使用,所以高可用主要指的是namenode的高可用,即存在两个namenode节点,一个为active状态,一个为standby状态.如下图: 说明如下:HDFS的HA,指的是在一个集群中存在两个NameNode,分别运行在独立的物理节点上.在任何时间点,只有一个NameNodes是处于Active状态,另一种是在Standby状态. Active