hadoop 的HA集群搭建

1.关闭防火墙

1.1 查看防火墙状态

service iptables status

1.2 关闭防火墙

service iptables off

1.3 关闭防火墙开机启动

chkconfig iptables off

2.关闭selinux

vi /etc/selinux/config

将 SELINUX=enforcing 改为 SELINUX=disabled

3.ssh免密登陆

ssh-keygen -t rsa

ssh-copy-id hostname

4.解压安装hadoop jdk zookeeper hive

tar -zxvf hadoop-2.7.2.tar.gz -C /opt/soft
tar -zxvf jdk-8u171-linux-x64.tar.gz -C /opt/soft
tar -zxvf zookeeper-3.4.5.tar.gz -C /opt/soft
tar -zxvf apache-hive-3.1.1-bin.tar.gz -C /opt/soft

5.配置hadoop jdk zookeeper hive 环境变量

5.1 打开添加

vi /etc/profile

5.2 添加

# Java Env
export JAVA_HOME=/opt/soft/jdk1.8.0_171
export JRE_HOME=/opt/soft/jdk1.8.0_171/jre
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:$JRE_HOME/lib
export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

# Hadoop Env
export HADOOP_HOME=/opt/soft/hadoop-2.7.2
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

# Zookeeper Env
export ZOOKEEPER_HOME=/opt/soft/zookeeper-3.4.5
export PATH=$PATH:$ZOOKEEPER_HOME/bin

# Hive Env
export HIVE_HOME=/opt/soft/apache-hive-3.1.1-bin
export PATH=$PATH:$HIVE_HOME/bin

5.3 使改动生效

source /etc/profile

6、配置zookeeper

6.1 创建zookeeper的数据及日志存放文件夹

mkdir /opt/soft/zookeeper-3.4.5/zkData

mkdir /opt/soft/zookeeper-3.4.5/logs

6.2 配置zoo.cfg

cd /opt/soft/zookeeper-3.4.5/conf

cp zoo_sample.cfg zoo.cfg

vi zoo.cfg

#发送心跳的间隔时间,单位:毫秒
tickTime=2000

#zookeeper保存数据的目录
dataDir=/opt/soft/zookeeper-3.4.5/zkData

#日志目录
dataLogDir=/opt/soft/zookeeper-3.4.5/logs

#端口
clientPort=2181

#leader和follower初始化连接时最长能忍受多少个心跳时间的间隔数
initLimit=5

#leader和follower之间发送消息,响应最长不能超过多少个tickTime的时间长度
syncLimit=2

#zookeeper机器列表
server.1=hadoop1:2888:3888
server.2=hadoop2:2888:3888
server.3=hadoop3:2888:3888

6.3 创建myid文件并写入数据

cd /opt/soft/zookeeper-3.4.5/zkData/

touch myid

echo 1 > myid

7、配置hadoop

7.1 修改core-site.xml

vim core-site.xml

7.2 修改hdfs-site.xml

vim hdfs-site.xml

7.3 修改mapred-site.xml

vim mapred-site.xml

7.4 修改yarn-site.xml

vim yarn-site.xml

7.5 修改slaves文件

vim slaves

8、初始化HA集群

8.1 每台机器启动zookeeper

zkServer.sh start

8.2 在任意一主节点上格式化zookeeper集群

hdfs zkfc -formatZK

8.3 每台机器上启动 journalnode

hadoop-daemon.sh start journalnode

8.4 在主节点格式化HDFS

hadoop namenode -format

8.5 在主节点启动HDFS和YARN

start-dfs.sh

start-yarn.sh

8.6 备用NN同步主NN的元数据信息(master2上执行)

hdfs namenode -bootstrapStandby

8.7 启动备用NN(master2上执行)

hadoop-daemon.sh start namenode

9、日常启动关闭HA集群

9.1 每台机器启动zookeeper

zkServer.sh start

9.2 在主节点启动HDFS和YARN

start-dfs.sh

start-yarn.sh

9.3 关闭HDFS和YARN

stop-all.sh

原文地址:https://www.cnblogs.com/sunburstcc/p/10105177.html

时间: 2024-10-07 11:50:07

hadoop 的HA集群搭建的相关文章

Hadoop-2.8.5的HA集群搭建

一.Hadoop HA 机制的学习 1.1.Hadoop 2.X 的架构图 2.x版本中,HDFS架构解决了单点故障问题,即引入双NameNode架构,同时借助共享存储系统来进行元数据的同步,共享存储系统类型一般有几类,如:Shared NAS+NFS.BookKeeper.BackupNode 和 Quorum Journal Manager(QJM),上图中用的是QJM作为共享存储组件,通过搭建奇数结点的JournalNode实现主备NameNode元数据操作信息同步. 1.2.QJM原理

Hadoop伪分布式集群搭建总结

Hadoop伪分布式集群搭建总结 一.所需软件VMware15!CentOS6.5JDK1.8Hadoop2.7.3二.安装注意:对文件进行编辑:输入a,表示对该文件进行编辑,最后保存该文件,操作为:点击键盘上的Esc按钮,然后输入英文的:字符,再输入wq,点击回车,完成文件的保存.1.关闭防火墙和禁用SELINUX(1).永久关闭防火墙,重启Linux系统(2) .禁用SELINUX:修改文件参数 重启Linux使其生效(3).检查防火墙是否运行,显示下图即为关闭2.配置hostname与IP

hadoop2.8 ha 集群搭建

简介: 最近在看hadoop的一些知识,下面搭建一个ha (高可用)的hadoop完整分布式集群: 搭建步骤: 1>  关闭防火墙,禁止设置开机启动: (1) //临时关闭 systemctl stop firewalld (2) //禁止开机启动 systemctl disable firewalld   注意:centos7防火墙默认是:firewalld centos6 的命令是: //临时关闭 service iptables stop //禁止开机启动 chkconfig iptabl

Hadoop全分布式集群搭建(详细)

一.准备物理集群.1.物理集群搭建方式.采用搭建3台虚拟机的方式来部署3个节点的物理集群.2.虚拟机准备.准备一个已近建好的虚拟机进行克隆.(建议为没进行过任何操作的)在要选择克隆的虚拟机上右击鼠标,管理,克隆.在弹出对话框中进行以下操作.(1).下一步.(2).选择虚拟机中的当前状态,下一步. (3).选择创建完整克隆,下一步.(4).输入虚拟机名称,下一步.(5).克隆完成.(6).按照上述步骤再创建一个虚拟机名称为slave02的.3.虚拟机网络配置.由于slave01和slave02虚拟

Hadoop(二)——分布式集群搭建

前两天和一个朋友在聊天的时候说,很多自学Hadoop的朋友80%都会夭折在集群环境的搭建上,原因吗无在乎:1,没有很好的电脑配置,不能像机房一样用多台电脑搭建起集群:2,对linux的不熟悉,各种小黑窗,linux命令--:3,环境搭建的反锁步骤,需要耐心+细心+认真等等吧.不过吗,我觉的,只要敢于坚持,敢于付出都是会成功的.下边讲述一下我的Hadoop集群搭建过程,由于条件有限,也是在虚拟机中进行的. 一,准备资料: 1,一台笔记本:I5的CPU,4G内存,500硬盘(内存有些小,运行的时候比

Hadoop完全分布式集群搭建

Hadoop的运行模式 Hadoop一般有三种运行模式,分别是: 单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统.,用于开发和调试. 伪分布式模式(Pseudo Distrubuted Mode),使用的是分布式文件系统,守护进程运行在本机机器,模拟一个小规模的集群,在一台主机模拟多主机,适合模拟集群学习. 完全分布式集群模式(Full Distributed Mode),Hadoop的守护进程运行在由多台主机搭建的集群上

hadoop伪分布式集群搭建与安装(ubuntu系统)

1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链接成功了: 3:修改主机的名称vi /etc/hostname和域名和主机映射对应的关系 vi /etc/hosts,改过之后即生效,自己可以ping一下,我这里ip对应master,比如ping master之后发现可以ping通即可: 4:修改过主机名称和主机名与ip对应的关系之后:开始上传jd

Hadoop2.7.5 HA集群搭建

1.安装CentOS 7.3操作系统mini版本即可 2.设置关闭Selinux *编辑  /etc/selinux/config vi /etc/selinux/config SELINUX=disabled *重启机器,查看selinux状态 sestatus # SELinux status:                 disabled 3.关闭Firewalld systemctl stop firewalld systemctl disable firewalld firewal

Hadoop伪分布式集群搭建-此文章在个人51.cto转载

一.HDFS伪分布式环境搭建 Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统.它和现有的分布式文件系统有很多共同点.但同时,它和其他的分布式文件系统的区别也是很明显的.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用.HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的.HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架