使用QJM部署HDFS HA集群

一、所需软件

　　1. JDK版本

　　　　下载地址：http://www.oracle.com/technetwork/java/javase/index.html

　　　　版本： jdk-7u79-linux-x64.gz

　　2. Hadoop软件

　　　　下载地址：http://hadoop.apache.org/releases.html

　　　　版本： hadoop-2.6.0.tar.gz

二、配置ssh免密码登陆：

　　查阅之前博客：http://www.cnblogs.com/yinchengzhe/p/4967928.html

三、环境说明

　　主备NameNode有多种配置，本文采用QJM(Quorum Journal Manager) ，主备NameNode应位于不同机器上

　　集群中包括4个节点：1个Master，3个Salve，节点之间局域网连接，可以相互ping通。

　　本人有3台云主机，主机名分别为h1,h2,h3。由于资源紧缺，master和其中一个salve共用h1主机。

　　搭建手动切换ha集群，较自动切换少了一个zookeeper集群。

　　主机分布情况如下：

　　h1: master namenode(主) journalnode datanode

　　h2: salve　 namenode(备) journalnode datanode

　　h3: salve　　　　　　　　　 journalnode datanode

四、HDFS HA (QJM)集群安装

　　参考官网site：http://hadoop.apache.org/docs/r2.6.0/hadoop-project-dist/hadoop-hdfs/HDFSHighAvailabilityWithQJM.html

　　1. 在h1上解压hadoop-2.6.0.tar.gz并重命名为hadoop

　　　　> tar zxvf hadoop-2.6.0.tar.gz

　　　　> mv hadoop-2.6.0 hadoop

　　2. 配置hadoop-env.sh

　　　　配置jdk路径，如： export JAVA_HOME=/root/software/jdk1.7.0_79

　　3. 配置core-site.xml

　　　　修改Hadoop核心配置文件core-site.xml，这里配置的是HDFS的地址和端口号

　　　　> cd /hadoop/etc/hadoop

　　　　> vim core-site.xml

　　　　配置如下：

　　　　

　　　　注：此处h1为本机的hostname

　　4. 配置slaves

　　　　此配置为master主机特有，配置此文件有两种方式

　　　　第一种：去掉"localhost"，每行只添加一个主机名，把所有的Slave主机名都填上。

　　　　　　如：h1

　　　　　　　　h2

　　　　　　　　h3

　　　　第二种：去掉"localhost"，加入集群中所有Slave机器的IP，也是每行一个。

　　　　　　如：192.168.1.1

　　　　　　　　192.168.1.2

　　　　　　　　192.168.1.3

　　5. 配置hdfs-site.xml

　　　　如下所示：

　　　　

　　　　(1). dfs.nameservices

　　　　　　集群中命名服务列表（自定义）

　　　　(2). dfs.ha.namenodes.[nameservice ID]

　　　　　　命名服务中的namenode逻辑名称（自定义）

　　　　(3). dfs.namenode.rpc-address.[nameservice ID].[name node ID]

　　　　　　命名服务中逻辑名称对应的RPC地址

　　　　(4). dfs.namenode.http-address.[nameservice ID].[name node ID]

　　　　　　命名服务中逻辑名称对应的HTTP地址

　　　　(5). dfs.namenode.name.dir

　　　　　　NameNode fsiamge存放目录

　　　　(6). dfs.namenode.shared.edits.dir

　　　　　　主备NameNode同步元信息的共享存储系统

　　　　(7). dfs.journalnode.edits.dir

　　　　　　Journal Node数据存放目录

　　6. 将h1上的hadoop文件夹复制到h2、h3节点上

　　7. 启动关闭HDFS

　　　　步骤1：在各个JournalNode节点上，输入以下命令启动journalnode服务：

　　　　　　　　> sbin/hadoop-daemon.sh start journalnode
　　　　步骤2：在[nn1]上，对其进行格式化，并启动：
　　　　　　　　> bin/hdfs namenode -format
　　　　　　　　> sbin/hadoop-daemon.sh start namenode
　　　　步骤3：在[nn2]上，同步nn1的元数据信息：
　　　　　　　　> bin/hdfs namenode -bootstrapStandby
　　　　步骤4：在[nn2]，启动NameNode：
　　　　　　　　> sbin/hadoop-daemon.sh start namenode
　　　　（经过以上四步操作，nn1和nn2均处理standby状态）
　　　　步骤5：在[nn1]上，将NameNode切换为Active
　　　　　　　　> bin/hdfs haadmin -transitionToActive nn1
　　　　步骤6：在[nn1]上，启动所有datanode
　　　　　　　　> sbin/hadoop-daemons.sh start datanode

　　　　启动成功可通过jps命令查看结果，如下所示：

　　　　

　　　　

　　　　

　　　　

　　　　关闭：

　　　　在[nn1]上输入命令 sbin/stop-dfs.sh

　　8. HDFS WEB界面浏览

　　　　Windows访问Linux方式参照 http://www.cnblogs.com/yinchengzhe/p/5012936.html

　　　　启动hdfs后界面如下：

　　　　

　　　　

时间： 2024-12-25 22:32:35

使用QJM部署HDFS HA集群的相关文章

菜鸟玩云计算之十八：Hadoop 2.5.0 HA 集群安装第1章

菜鸟玩云计算之十八:Hadoop 2.5.0 HA 集群安装第1章 cheungmine, 2014-10-25 0 引言在生产环境上安装Hadoop高可用集群一直是一个须要极度耐心和体力的仔细工作. 虽然有非常多文档教会大家怎么一步一步去完毕这样的工作,可是百密也有一疏. 现成的工具不是没有,可是对于我这个喜欢了解细节的人来说,用别人的东西,写的好还能够,写的不好,出了问题,查找错误难之又难.手工安装Hadoop集群须要对Linux有一定的使用经验.对于全然没有接触Linux的人来说.肯定是

Hadoop HA集群的搭建

HA 集群搭建的难度主要在于配置文件的编写, 心细,心细,心细! ha模式下,secondary namenode节点不存在... 集群部署节点角色的规划(7节点)------------------server01 namenode zkfcserver02 namenode zkfcserver03 resourcemanagerserver04 resourcemanagerserver05 datanode nodemanager zookeeper journal nodeserver

Hadoop-2.8.5的HA集群搭建

一.Hadoop HA 机制的学习 1.1.Hadoop 2.X 的架构图 2.x版本中,HDFS架构解决了单点故障问题,即引入双NameNode架构,同时借助共享存储系统来进行元数据的同步,共享存储系统类型一般有几类,如:Shared NAS+NFS.BookKeeper.BackupNode 和 Quorum Journal Manager(QJM),上图中用的是QJM作为共享存储组件,通过搭建奇数结点的JournalNode实现主备NameNode元数据操作信息同步. 1.2.QJM原理

架构之高可用性(HA)集群(Keepalived)

Keepalived简介 Keepalived是Linux下一个轻量级别的高可用解决方案.高可用(High Avalilability,HA),其实两种不同的含义:广义来讲,是指整个系统的高可用行,狭义的来讲就是之主机的冗余和接管, 它与HeartBeat RoseHA 实现相同类似的功能,都可以实现服务或者网络的高可用,但是又有差别,HeartBeat是一个专业的.功能完善的高可用软件,它提供了HA 软件所需的基本功能,比如:心跳检测.资源接管,检测集群中的服务,在集群节点转移共享IP地址的所

HA集群之DRBD浅析及实现DRBD高可用

一.DRBD概述 DRBD (Distributed Replicated Block Device) 是 Linux 平台上的分散式储存系统. 由内核模组.用户空间工具组成,通常用于高可用性(high availability, HA)集群.其实现方式是通过网络在服务器之间的对块设备(硬盘,分区,逻辑卷等)进行镜像.你可以把它看作是一种网络RAID1. DRBD的工作模式如下图: DRBD工作的位置在文件系统的buffer cache和磁盘调度器之间,数据进入Buffer Cache后,DRB

corosync+pacemaker实现高可用(HA)集群

corosync+pacemaker实现高可用(HA)集群(一) ????重要概念在准备部署HA集群前,需要对其涉及的大量的概念有一个初步的了解,这样在实际部署配置时,才不至于不知所云资源.服务与主机(又称节点)的关系: 资源包括vip,httpd,filesystem等: 可整合多个资源形成一个服务: 服务必运行在某个主机上,主机上也可不运行服务(此为空闲主机): 服务里的所有资源应该同时运行在同一个节点上,实现方式有2种: 资源组: 排列约束资源类型 primitive(或native

【2016.04.04】HA集群配置

1.HA(High Availability)指的是通过尽量缩短因日常维护操作(计划)和突发的系统崩溃(非计划)所导致的停机时间,以提高系统和应用的可用性.它与被认为是不间断操作的容错技术有所不同.HA系统是目前企业防止核心计算机系统因故障停机的最有效手段.常使用"heartbeat"开源软件实现HA集群部署. 2.HA架构示意图 3.实验环境 [[email protected] ~]# ifconfig eth0 Link encap:Ethernet HWaddr 00:0C:2

将java开发的wordcount程序部署到spark集群上运行

1 package cn.spark.study.core; 2 3 import java.util.Arrays; 4 5 import org.apache.spark.SparkConf; 6 import org.apache.spark.api.java.JavaPairRDD; 7 import org.apache.spark.api.java.JavaRDD; 8 import org.apache.spark.api.java.JavaSparkContext; 9 impo

部署Hadoop高性能集群

部署Hadoop高性能集群服务器概述 1)Hadoop是什么 Hadoop是Lucene创始人Doug Cutting,根据Google的相关内容山寨出来的分布式文件系统和对海量数据进行分析计算的基础框架系统,其中包含MapReduce程序,hdfs系统等. Hadoop包括两大核心,分布式存储系统和分布式计算系统. 2)分布式存储为什么数据需要存储在分布式的系统中哪,难道单一的计算机存储不了吗,难道现在的几个TB的硬盘装不下这些数据吗?事实上,确实装不下.比如,很多的电信通话记彔就存储在很

猜你喜欢

C++中 int i 与 int &i 注意事项

来源:http://blog.csdn.net/qianchenglenger/article/details/16949689 1.int i 传值,int & i 传引用 int i不会回 ...

Spring+Hibernate的典型配置

Spring 框架提供了对 Hibernate.JDO 和 iBATIS SQL Maps 的集成支持.Spring 对 Hibernate 的支持是第一级的,整合了许多 IOC 的方便特性,解决了许 ...

2014,我的创业记忆片段----谨以此文献给《2013,我的创业记忆片段》

2014,我的创业记忆片段 ----谨以此文献给<2013,我的创业记忆片段> 2013年底的一个周末的下午,我一人来到位于上海的办公室,坐下来,想了想,平静地写了<2013,我的创 ...

Linux开发平台的搭建之Vim

一直都认为Linux很强大,但是让我说它哪里强,我还真说不出来.所以打算从今天开始学习Linux,基于前期掌握了一些基础的Linux操作命令,在这就不一一介绍.好的开发都是从搭建一个优秀稳定可靠的平台 ...

掌握Thinkphp3.2.0----内置标签

使用内置标签的时候,一定要注意闭合-----单标签自闭合,双标签对应闭合标签的学习在于记忆和应用一．判断比较 1 //IF 语句的完整格式 2 <if condition="$u ...

Android学习总结——系统提示对话框(AlertDialog)

new AlertDialog.Builder(MainActivity.this).setTitle("退出")//设置对话框标题 .setMessage("官人可是要 ...

用Eclipse插件Bytecode Outline来查看Java字节码

在遇到一些小问题的时候我们经常会使用Javap反编译取得字节码来分析,虽然Javap能完成这个工作,但是有两个缺点,一方面操作麻烦,需要很多步骤,一方面没有文档注释,对新手来说看起字节码来比较麻烦. ...

C#登陆窗体跳转

我们在做登录界面,点击登录按钮时,我们希望它关闭现在的窗体然后跳转到我们所需要登录到窗体,而且我们只希望有一个窗体在桌面上,而不是一个个窗体之间的重叠.我们在登陆界面类里面做好两个bool类型,用来标 ...

创建用户及表空间

Oracle 11.2.0.1 1. 创建新的用户默认表空间DCSOPEN_TBS: 注: (1) 这里设置初始数据文件大小是200M,AUTOEXTEND属性默认自动增长,每次申请新的表空间时会分配 ...

表单标签form包含 1.文本输入输入标签input,type输入的格式,value为默认值(默认文字是什么) 文本框text,如账号框<input type="text" ...

烂泥：vcenter通过模板部署vm

前一篇文章我们介绍了有关vcenter5.5的安装与配置,这篇文章我们再来介绍下,如何通过vcenter的vm模板来部署虚拟机以及在部署过程遇到问题的解决方法. 一.生成VM模板要生成vm模板,我们 ...

Android实战简易教程-第五十二枪（Fragment和Activity之间通信）

Fragment的使用可以让我们的应用更灵活的适配各种型号的安卓设备,但是对于Fragment和Activity之间的通信,很多朋友应该比较陌生,下面我们就通过一个实例来看一看如何实现. 一.Acti ...

xcode编译出错：Undefined symbols for architecture armv7

在xcode中编译oc和c++代码时出现如下错误: Undefined symbols for architecture armv7 "std::basic_ostream<char, ...

RSS订阅推荐

科技新闻虎嗅网 http://www.huxiu.com/ 科技博客的新生力量,文章以观点鲜明出名: 36氪 http://www.36kr.com/ 科技博客,关注创业,可以免费发表创业公司新闻 ...

POJ - 1159 - Palindrome （LCS + 优化）

题目传送:Palindrome 思路:一看题目思路很清晰,就是求出字符串s和倒转s后的字符串t的最长公共子序列,但是一看空间开销有点大,如果开int就会爆,5000*5000有100MB了,这里可以开 ...

Unity 之添加背景音乐以及 Slider控制

游戏音频分为背景音乐与环境音乐两种.Audio Clip(音频剪辑)有四种音乐格式.MP3:适合较长音频,作为背景音乐.Ogg:适合较长音频,作为背景音乐.Wav:适合较短音频,作为环境音乐.Ai ...

芰倭芘帜终ob0ktvx49t0m

新华社瓦莱塔4月10日电(记者李拯宇李佳)全国政协主席俞正声10日在前往非洲三国进行正式友好访问途中过境马耳他,在瓦莱塔会见马耳他议长法鲁贾. 俞正声说,中马保持长期友好关系,政治上相互信任,经济上 ...

jquery-mockjax初试

1. 原理 jquery-mockjax是用于mock 前台ajax向后台请求的返回数据. 原理很简单在你js代码要发送ajax请求的地方断点一下,然后比较在[引入jquery-mockjax] 和 ...

Ruby七天入门(2 函数，数组和类)

DAY 2 第二天学习继续,今天重点学习函数,数组和类等编程的基本要素. 2.1 函数 2.1.1 简单定义 def tell_me puts true end 定义一个简单的函数(无参无返回值)很简 ...

mybatis整合memcache

We have just released the 1st GA version of the MyBatis Memcached adapter. The beta has bee around f ...

专题

随机推荐

© 2025 憋错料 | info#biecuoliao.com | 10 q. 0.024 s.