Hadoop学习之路(五)Hadoop集群搭建模式和各模式问题

分布式集群的通用问题

当前的HDFS和YARN都是一主多从的分布式架构,主从节点---管理者和工作者

问题:如果主节点或是管理者宕机了。会出现什么问题?

群龙无首,整个集群不可用。所以在一主多从的架构中都会有一个通用的问题:

当集群中的主节点宕机之后,整个集群不可用。这个现象叫做:单点故障。SPOF

单点故障讲述的概念有两点

1、如果说宕机的那个节点是从节点,那么整个集群能够继续运行,并且对外提供正常的服务。

2、如果说宕机的那个节点是主节点,那么整个集群就处于宕机状态。

通用的解决方案:高可用

概念:当正在对外提供服务器的主从节点宕机,那么备用的主节点立马上位对外提供服务。无缝的瞬时切换。

皇帝驾崩,太子继位。

集群的搭建的集中通用模式

1、单机模式

  表示所有的分布式系统都是单机的。

2、伪分布式模式(搭建在了只有一个节点的集群中)

  表示集群中的所有角色都分配给了一个节点。

  表示整个集群被安装在了只有一个节点的集群中的。

  主要用于做快速使用,去模拟分布式的效果。

3、分布式模式

  表示集群中的节点会被分配成很多种角色,分散在整个集群中。

  主要用于学习测试等等一些场景中。

4、高可用模式

  表示整个集群中的主节点会有多个

  注意区分:能够对外提供服务的主节点还是只有一个。其他的主节点全部处于一个热备的状态。

  正在对外提供服务的主节点:active  有且仅有一个

  热备的主节点:standby  可以有多个

  工作模式:1、在任意时刻,只有一个主节点是active的,active的主节点对外提供服务

       2、在任意时刻,都应至少有一个standby的主节点,等待active的宕机来进行接替

  架构模式:就是为了解决分布式集群中的通用问题SPOF

  不管是分布式架构还是高可用架构,都存在一个问题:主从结构---从节点数量太多了。最直观的的问题:造成主节点的工作压力过载,主节点会宕机,当前的这种现象是一种死循环

5、联邦模式

  表示当前集群中的主从节点都可以有很多个。

  1)主节点:可以有很多个的意思是说:同时对外提供服务的主节点有很多个。

            重点:每一个主节点都是用来管理整个集群中的一部分

  2)从节点:一定会有很多个。

  在联邦模式下还是会有问题:

  虽然这个集群中的一个主节点的压力被分摊到了多个主节点。但是这个多个主节点依然会有一个问题:SOFP

安装Hadoop集群中的一些通用问题

1、假如安装不成功,并且不知道应该怎么去解决这个安装错误:重装

   需要做的处理:处理安装步骤中不同的部分即可。第一次安装和重装时候的不同步骤:

   1)到修改配置文件以前,全部都不用动

   2)检查配置文件是否都正确

    先检查一个节点上的配置文件是否都正确,如果都正确,重新分发一次即可

   3)在安装分布式集群时,所有节点中的安装的安装目录和安装者,需要检查和确定

   4)删掉数据目录

    A. 删除主节点的工作目录:namenode的数据目录

        删除即可,只需要在主节点删除即可

    B. 删除从节点的工作目录:datanode的数据目录

        删除即可,把每个从节点上的这个对应数据目录都删掉

        如果以上两份数据都被删除了之后。整个集群当中就相当于没有存储任何的历史数据。所以就是一个全新的集群

 5)在确保数据正常和安装包都正常之后,进行重新初始化

     重点强调: hadoop集群的初始化,其实就是初始化HDFS集群, 只能在主节点进行初始化

     如果你只需要搭建YARN集群,那么是可以不用做初始化的。

  6)启动集群

  7)验证集群是否成功

Linux环境变量加载的顺序

用户环境变量 :仅仅只是当前用户使用 ~/.bashrc   ~/.bash_profile
系统环境变量 :给当前系统中的所有用户使用 /etc/profile

任何普通用户在进行登录的时候:会同时加载几个环境变量的配置文件:

按顺序:
1、/etc/profile
2、~/.bash_profile
3、~/.bashrc

原文地址:https://www.cnblogs.com/qingyunzong/p/8521435.html

时间: 2024-08-15 17:26:14

Hadoop学习之路(五)Hadoop集群搭建模式和各模式问题的相关文章

Hadoop学习之路(1)腾讯云搭建Hadoop3集群

1主机名和IP配置 1.1主机名 1.首先使用root用户名和root密码分别登录三台服务器2.分别在三台虚拟机上执行命令:hostnamectl set-hostname node1hostnamectl set-hostname node2hostnamectl set-hostname node33.分别在三台服务器上执行logout 1.2 IP设置 systemctl restart network 2配置免密登录 2.1 生成公钥和私钥 使用此命令:ssh-keygen -t rsa

【整理学习Hadoop】Hadoop学习基础之一:服务器集群技术

        服务器集群就是指将很多服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器.集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能正常运行. 集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能.可靠性.灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术.集群是一组相互独立的.通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理

spark学习笔记-CentOS 6.4集群搭建(2)

CentOS 6.5安装 1.使用课程提供的CentOS 6.5镜像即可,CentOS-6.5-i386-minimal.iso. 2.创建虚拟机:打开Virtual Box,点击"新建"按钮,点击"下一步",输入虚拟机名称为spark1,选择操作系统为Linux,选择版本为Red Hat,分配1024MB内存,后面的选项全部用默认,在Virtual Disk File location and size中,一定要自己选择一个目录来存放虚拟机文件,最后点击"

高可用mongodb集群的学习记录(四mongodb分片集群搭建)

无论oracle还是mysql数据库都有分区的概念,即同一张表物理上不在同一台机器上,有效缓解了表都集中存在一台机器的压力.当然,mongodb也有类似的机制,即是分片.具体理论知识大家可以参考网上文档,我这里只记录下具体操作步骤 参考网络上一个图.我选用的是2个副本集+1个仲裁.实际上我这里分片集群需要3个mongos,3个config server,数据分片3个shard server,对应着还有3个副本,3个仲裁节点,总共需要15个实例.因为我资源确实紧张,又不想影响实验效果.冥思苦想了一

redis--(五)集群搭建

这里没有六台虚拟机,在一台上模拟 cluster nodes 查看当前是否是集群 集群环境关闭只能一台台关闭,重新创建集群环境首先把nodes-700*.com删掉去创建

Hadoop-1.0.4集群搭建笔记

这篇文章介绍的是简单的配置Hadoop集群的方法,适合实验和小型项目用,正式运行的集群需要用更正规的方法和更详细的参数配置,不适合使用这篇文章. 安装 JDK 在终端输入 $ java -version 如果有反应,说明已安装过jdk.如果显示的信息里出现了类似OpenJDK的字样,如 java version "1.6.0_20" OpenJDK Runtime Environment (IcedTea6 1.9.2) (6b20-1.9.2-0ubuntu1~10.04.1) Op

JAVAEE——宜立方商城08:Zookeeper+SolrCloud集群搭建、搜索功能切换到集群版、Activemq消息队列搭建与使用

1. 学习计划 1.solr集群搭建 2.使用solrj管理solr集群 3.把搜索功能切换到集群版 4.添加商品同步索引库. a) Activemq b) 发送消息 c) 接收消息 2. 什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud.当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发很高,这时需要使用SolrCloud来满足这些需求. So

Hadoop学习之路(四)Hadoop集群搭建和简单应用

概念了解 主从结构:在一个集群中,会有部分节点充当主服务器的角色,其他服务器都是从服务器的角色,当前这种架构模式叫做主从结构. 主从结构分类: 1.一主多从 2.多主多从 Hadoop中的HDFS和YARN都是主从结构,主从结构中的主节点和从节点有多重概念方式: 1.主节点 从节点 2.master slave 3.管理者 工作者 4.leader follower Hadoop集群中各个角色的名称: 服务 主节点 从节点 HDFS NameNode DataNode YARN Resource

Hadoop学习之路(七)Hadoop集群shell常用命令

Hadoop常用命令 启动HDFS集群 [[email protected] ~]$ start-dfs.sh Starting namenodes on [hadoop1] hadoop1: starting namenode, logging to /home/hadoop/apps/hadoop-2.7.5/logs/hadoop-hadoop-namenode-hadoop1.out hadoop2: starting datanode, logging to /home/hadoop/

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建 图文详解

引言 在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单机的搭建,是因为作为个人学习的话,单机已足以,好吧,说实话是自己的电脑不行,使用虚拟机实在太卡了... 整个的集群搭建是在公司的测试服务搭建的,在搭建的时候遇到各种各样的坑,当然也收获颇多.在成功搭建大数据集群之后,零零散散的做了写笔记,然后重新将这些笔记整理了下来.于是就有了本篇博文. 其实我在搭