Hadoop学习之路（五）Hadoop集群搭建模式和各模式问题

分布式集群的通用问题

当前的HDFS和YARN都是一主多从的分布式架构，主从节点---管理者和工作者

问题：如果主节点或是管理者宕机了。会出现什么问题？

群龙无首，整个集群不可用。所以在一主多从的架构中都会有一个通用的问题：

当集群中的主节点宕机之后，整个集群不可用。这个现象叫做：单点故障。SPOF

单点故障讲述的概念有两点

1、如果说宕机的那个节点是从节点，那么整个集群能够继续运行，并且对外提供正常的服务。

2、如果说宕机的那个节点是主节点，那么整个集群就处于宕机状态。

通用的解决方案：高可用

概念：当正在对外提供服务器的主从节点宕机，那么备用的主节点立马上位对外提供服务。无缝的瞬时切换。

皇帝驾崩，太子继位。

集群的搭建的集中通用模式

1、单机模式

　　表示所有的分布式系统都是单机的。

2、伪分布式模式（搭建在了只有一个节点的集群中）

　　表示集群中的所有角色都分配给了一个节点。

　　表示整个集群被安装在了只有一个节点的集群中的。

　　主要用于做快速使用，去模拟分布式的效果。

3、分布式模式

　　表示集群中的节点会被分配成很多种角色，分散在整个集群中。

　　主要用于学习测试等等一些场景中。

4、高可用模式

　　表示整个集群中的主节点会有多个

　　注意区分：能够对外提供服务的主节点还是只有一个。其他的主节点全部处于一个热备的状态。

　　正在对外提供服务的主节点：active　　有且仅有一个

　　热备的主节点：standby　　可以有多个

　　工作模式：1、在任意时刻，只有一个主节点是active的，active的主节点对外提供服务

　　　　　　　2、在任意时刻，都应至少有一个standby的主节点，等待active的宕机来进行接替

　　架构模式：就是为了解决分布式集群中的通用问题SPOF

　　不管是分布式架构还是高可用架构，都存在一个问题：主从结构---从节点数量太多了。最直观的的问题：造成主节点的工作压力过载，主节点会宕机，当前的这种现象是一种死循环

5、联邦模式

　　表示当前集群中的主从节点都可以有很多个。

　　1）主节点：可以有很多个的意思是说：同时对外提供服务的主节点有很多个。

　　　　　　重点：每一个主节点都是用来管理整个集群中的一部分

　　2）从节点：一定会有很多个。

　　在联邦模式下还是会有问题：

　　虽然这个集群中的一个主节点的压力被分摊到了多个主节点。但是这个多个主节点依然会有一个问题：SOFP

安装Hadoop集群中的一些通用问题

1、假如安装不成功，并且不知道应该怎么去解决这个安装错误：重装

　需要做的处理：处理安装步骤中不同的部分即可。第一次安装和重装时候的不同步骤：

　 1）到修改配置文件以前，全部都不用动

　 2）检查配置文件是否都正确

　　　　先检查一个节点上的配置文件是否都正确，如果都正确，重新分发一次即可

　 3）在安装分布式集群时，所有节点中的安装的安装目录和安装者，需要检查和确定

　 4）删掉数据目录

　　　　A.　删除主节点的工作目录：namenode的数据目录

　　　　　删除即可，只需要在主节点删除即可

　　　　B.　删除从节点的工作目录：datanode的数据目录

　　　　　删除即可，把每个从节点上的这个对应数据目录都删掉

　　　　　如果以上两份数据都被删除了之后。整个集群当中就相当于没有存储任何的历史数据。所以就是一个全新的集群

　5）在确保数据正常和安装包都正常之后，进行重新初始化

　　重点强调： hadoop集群的初始化，其实就是初始化HDFS集群，只能在主节点进行初始化

　　如果你只需要搭建YARN集群，那么是可以不用做初始化的。

　 6）启动集群

　 7）验证集群是否成功

Linux环境变量加载的顺序

用户环境变量：仅仅只是当前用户使用 ~/.bashrc　　 ~/.bash_profile
系统环境变量：给当前系统中的所有用户使用 /etc/profile

任何普通用户在进行登录的时候：会同时加载几个环境变量的配置文件：

按顺序：
1、/etc/profile
2、~/.bash_profile
3、~/.bashrc

原文地址：https://www.cnblogs.com/qingyunzong/p/8521435.html

时间： 2024-08-15 17:26:14

Hadoop学习之路（五）Hadoop集群搭建模式和各模式问题的相关文章

Hadoop学习之路(1)腾讯云搭建Hadoop3集群

1主机名和IP配置 1.1主机名 1.首先使用root用户名和root密码分别登录三台服务器2.分别在三台虚拟机上执行命令:hostnamectl set-hostname node1hostnamectl set-hostname node2hostnamectl set-hostname node33.分别在三台服务器上执行logout 1.2 IP设置 systemctl restart network 2配置免密登录 2.1 生成公钥和私钥使用此命令:ssh-keygen -t rsa

【整理学习Hadoop】Hadoop学习基础之一：服务器集群技术

服务器集群就是指将很多服务器集中起来一起进行同一种服务,在客户端看来就像是只有一个服务器.集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能正常运行. 集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能.可靠性.灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术.集群是一组相互独立的.通过高速网络互联的计算机,它们构成了一个组,并以单一系统的模式加以管理

spark学习笔记-CentOS 6.4集群搭建（2）

CentOS 6.5安装 1.使用课程提供的CentOS 6.5镜像即可,CentOS-6.5-i386-minimal.iso. 2.创建虚拟机:打开Virtual Box,点击"新建"按钮,点击"下一步",输入虚拟机名称为spark1,选择操作系统为Linux,选择版本为Red Hat,分配1024MB内存,后面的选项全部用默认,在Virtual Disk File location and size中,一定要自己选择一个目录来存放虚拟机文件,最后点击"

高可用mongodb集群的学习记录(四mongodb分片集群搭建)

无论oracle还是mysql数据库都有分区的概念,即同一张表物理上不在同一台机器上,有效缓解了表都集中存在一台机器的压力.当然,mongodb也有类似的机制,即是分片.具体理论知识大家可以参考网上文档,我这里只记录下具体操作步骤参考网络上一个图.我选用的是2个副本集+1个仲裁.实际上我这里分片集群需要3个mongos,3个config server,数据分片3个shard server,对应着还有3个副本,3个仲裁节点,总共需要15个实例.因为我资源确实紧张,又不想影响实验效果.冥思苦想了一

redis--（五）集群搭建

这里没有六台虚拟机,在一台上模拟 cluster nodes 查看当前是否是集群集群环境关闭只能一台台关闭,重新创建集群环境首先把nodes-700*.com删掉去创建

Hadoop-1.0.4集群搭建笔记

这篇文章介绍的是简单的配置Hadoop集群的方法,适合实验和小型项目用,正式运行的集群需要用更正规的方法和更详细的参数配置,不适合使用这篇文章. 安装 JDK 在终端输入 $ java -version 如果有反应,说明已安装过jdk.如果显示的信息里出现了类似OpenJDK的字样,如 java version "1.6.0_20" OpenJDK Runtime Environment (IcedTea6 1.9.2) (6b20-1.9.2-0ubuntu1~10.04.1) Op

JAVAEE——宜立方商城08：Zookeeper+SolrCloud集群搭建、搜索功能切换到集群版、Activemq消息队列搭建与使用

1. 学习计划 1.solr集群搭建 2.使用solrj管理solr集群 3.把搜索功能切换到集群版 4.添加商品同步索引库. a) Activemq b) 发送消息 c) 接收消息 2. 什么是SolrCloud SolrCloud(solr 云)是Solr提供的分布式搜索方案,当你需要大规模,容错,分布式索引和检索能力时使用 SolrCloud.当一个系统的索引数据量少的时候是不需要使用SolrCloud的,当索引量很大,搜索请求并发很高,这时需要使用SolrCloud来满足这些需求. So

Hadoop学习之路（四）Hadoop集群搭建和简单应用

概念了解主从结构:在一个集群中,会有部分节点充当主服务器的角色,其他服务器都是从服务器的角色,当前这种架构模式叫做主从结构. 主从结构分类: 1.一主多从 2.多主多从 Hadoop中的HDFS和YARN都是主从结构,主从结构中的主节点和从节点有多重概念方式: 1.主节点从节点 2.master slave 3.管理者工作者 4.leader follower Hadoop集群中各个角色的名称: 服务主节点从节点 HDFS NameNode DataNode YARN Resource

Hadoop学习之路（七）Hadoop集群shell常用命令

Hadoop常用命令启动HDFS集群 [[email protected] ~]$ start-dfs.sh Starting namenodes on [hadoop1] hadoop1: starting namenode, logging to /home/hadoop/apps/hadoop-2.7.5/logs/hadoop-hadoop-namenode-hadoop1.out hadoop2: starting datanode, logging to /home/hadoop/

大数据学习系列之七 ----- Hadoop+Spark+Zookeeper+HBase+Hive集群搭建图文详解

引言在之前的大数据学习系列中,搭建了Hadoop+Spark+HBase+Hive 环境以及一些测试.其实要说的话,我开始学习大数据的时候,搭建的就是集群,并不是单机模式和伪分布式.至于为什么先写单机的搭建,是因为作为个人学习的话,单机已足以,好吧,说实话是自己的电脑不行,使用虚拟机实在太卡了... 整个的集群搭建是在公司的测试服务搭建的,在搭建的时候遇到各种各样的坑,当然也收获颇多.在成功搭建大数据集群之后,零零散散的做了写笔记,然后重新将这些笔记整理了下来.于是就有了本篇博文. 其实我在搭