Hadoop2.7.2安装与集群搭建


1.环境准备

jdk需要1.7以上版本64位.

创建hadoop用户.

在hadoop用户目录下解压安装包hadoop-2.7.2.tar.gz


2.配置免密码登录

  • 各节点分别执行

生成公钥和私钥:ssh-keygen -t rsa

四次enter.

将公钥添加进公钥库:cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

修改authorized_keys权限:chmod 600 ~/.ssh/authorized_keys

验证:ssh localhost

  • 拷贝

将各节点中id_rsa.pub中的内容共同拷贝到authorized_keys,将authorized_keys覆盖各节点.


3.创建目录

mkdir -p ~/hadoop/dfs/name

mkdir -p ~/hadoop/dfs/data

mkdir -p ~/hadoop/tmp


4.修改配置文件

  • core-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
       <name>hadoop.tmp.dir</name>
       <value>/home/wangkai/hadoop/tmp</value>
</property>
<property>
       <name>fs.defaultFS</name>
       <value>hdfs://centos7-1:9000</value>
</property>
</configuration>

  • hdfs-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/home/wangkai/hadoop/dfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/home/wangkai/hadoop/dfs/data</value>
    </property>
</configuration>

  • yarn-site.xml
<?xml version="1.0"?>
<configuration>
 <property>
 <name>mapreduce.framework.name</name>
 <value>yarn</value>
 </property>
 <property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
 </property>
<property>
 <name>yarn.resourcemanager.hostname</name>
 <value>192.168.163.101</value>
 </property>
</configuration>

注:不配置yarn.resourcemanager.hostname可能会导致从节点的nodemanager无法与主节点resourcemanager通信,默认为0.0.0.0,需要修改.


  • slaves
centos7-1
centos7-2
centos7-3

  • hadoop-env.sh

第一行添加

export JAVA_HOME=/usr/local/jdk1.7.0_79

  • yarn-env.sh

第一行添加:

export JAVA_HOME=/usr/local/jdk1.7.0_79

5.修改系统文件(各节点)

  • /etc/hosts

文件末尾添加

192.168.163.101 centos7-1
192.168.163.102 centos7-2
192.168.163.103 centos7-3

  • ~/.bashrc

文件末尾添加

export JAVA_HOME=/usr/local/jdk1.7.0_79
export HADOOP_HOME=/home/wangkai/hadoop
export CLASSPATH=$JAVA_HOME/lib:$JAVA_HOME/jre/lib:$CLASSPATH
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source ~/.bashrc


6.启动

将Hadoop文件夹移动至各个节点

  • 清空以下目录

/home/wangkai/hadoop/dfs/name

/home/wangkai/hadoop/dfs/data

/home/wangkai/hadoop/tmp


  • 启动hdfs

执行格式化:hadoop namenode -format

执行start-dfs.sh

查看进程应显示:

NameNode

DataNode

SecondaryNameNode

浏览器访问:192.168.163.101:50070

注意:关闭防火墙

systemctl stop firewalld.service

systemctl disable firewalld.service


  • 启动yarn

执行start-yarn.sh

查看进程应显示:

NodeManager

ResourceManager

浏览器访问: 192.168.163.101:8088


7.Hadoop及其生态的环境匹配

一个典型搭配

Hadoop 2.7.2,HBase 1.2.2 , Hive 2.1.0 ,Zookeeper 3.4.8 ,Sqoop 1.4.6 , Spark 2.0.2 ,Kafka 2.11-0.10.0.0等等



Hadoop2.7.2安装与集群搭建

原文地址:https://www.cnblogs.com/guan-li/p/9916928.html

时间: 2024-10-08 08:16:14

Hadoop2.7.2安装与集群搭建的相关文章

Hbase1.2.2安装和集群搭建

1.环境准备 jdk1.7.0_79 Hadoop2.7.2.(匹配Hbase1.2.2) zookeeer3.4.8 hbase-1.2.2-bin.tar.gz 最好和hadoop安装在统一用户下,解压安装包 tar zxvf hbase-1.2.2-bin.tar.gz 2. 修改配置文件 .bashrc(多节点) export JAVA_HOME=/usr/local/jdk1.7.0_79 export HADOOP_HOME=/home/hadoop/hadoop export HB

Hadoop-2.8.5的HA集群搭建

一.Hadoop HA 机制的学习 1.1.Hadoop 2.X 的架构图 2.x版本中,HDFS架构解决了单点故障问题,即引入双NameNode架构,同时借助共享存储系统来进行元数据的同步,共享存储系统类型一般有几类,如:Shared NAS+NFS.BookKeeper.BackupNode 和 Quorum Journal Manager(QJM),上图中用的是QJM作为共享存储组件,通过搭建奇数结点的JournalNode实现主备NameNode元数据操作信息同步. 1.2.QJM原理

RabbitMQ的安装及集群搭建方法

RabbitMQ安装 1 安装erlang 下载地址:http://www.erlang.org/downloads 博主这里采用的是otp_src_19.1.tar.gz (200MB+) [[email protected] util]# tar zxvf otp_src_19.1.tar.gz [[email protected] util]# cd otp_src_19.1 [[email protected] otp_src_19.1]# ./configure --prefix=/o

rabbitmq安装、集群搭建

rabbitmq的安装: CentOS上面部署: 首先修改hosts文件 修改hosts文件vi /etc/hosts1.1.1.1 hostname 2.2.2.2 hostname 3.3.3.3 hostname erlang的安装环境:rpm -i http://mirror.bjtu.edu.cn/fedora-epel/6/x86_64/epel-release-6-8.noarch.rpmyum install erlang安装rabbitMQ(RPM链接可以从http://www

rabbitMQ 安装,集群搭建, 编码

RabbitMQ 一.背景 命令行工具: http://www.rabbitmq.com/man/rabbitmqctl.1.man.html 介绍入门文章: http://blog.csdn.net/anzhsoft/article/details/19563091 内容比较清晰: http://www.diggerplus.org/archives/3110 Exchange.Queue producer把消息发送到Exchange(带上route key),consumer声明queue(

Redis安装与集群搭建

1 1.1   安装redis n  版本说明 本教程使用redis3.0版本.3.0版本主要增加了redis集群功能. 安装的前提条件: 需要安装gcc:yum install gcc-c++ 1.下载redis的源码包. 2.把源码包上传到linux服务器 3.解压源码包 tar -zxvf redis-3.0.0.tar.gz 4.Make 5.Make install [[email protected] redis-3.0.0]# make install PREFIX=/usr/lo

十分钟教你学会zookeeper安装和集群搭建(伪集群 )

1. zookeeper介绍 ZooKeeper是一个为分布式应用所设计的分布的.开源的协调服务,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,简化分布式应用协调及其管理的难度,提供高性能的分布式服务.ZooKeeper本身可以以Standalone模式安装运行,不过它的长处在于通过分布式ZooKeeper集群(一个Leader,多个Follower),基于一定的策略来保证ZooKeeper集群的稳定性和可用性,从而实现分布式应用的可靠性. ZooKeeper是作为分布式协调服务,是不

zookeeper3.4.8安装和集群搭建

1.环境准备 创建zookeeper用户. 准备安装包: zookeeper-3.4.8.tar.gz. 拷贝至安装目录并解压 tar zxvf zookeeper-3.3.6.tar.gz mv zookeeper-3.3.6 zookeeper 2.配置文件 zookeeper/conf/zoo.cfg(需手动创建) #zookeeper使用的基本时间单位(ms) tickTime=2000 #leader和follow之间的最长心跳时间(ticktime的倍数) initLimit=5 #

kubernetes安装部署集群搭建示例

### 系统环境准备(CentOS 7.2): a) # systemctl disable firewalld b) # sed -i s'/SELINUX=enforcing/SELINUX=disabled/g' /etc/sysconfig/selinux c) # yum -y update && reboot d) # yum -y install ntpdate && ntpdate cn.pool.ntp.org Master : 192.168.11.10