GFS分布式文件系统集群(理论篇)

GlusterFS概述

GlusterFS简介

  • 开源的分布式文件系统
  • 由存储服务器,客户端以及NFS/Samba存储网关组成
  • 无元数据服务器

GlusterFS的特点

  • 扩展性和高性能
  • 高可用性
  • 全局统一的命名空间
  • 弹性卷管理
  • 基于标准协议

GlusterFS术语

  • Brick : 存储节点
  • Volume : 卷
  • FUSE : 内核模块,用户端的交互模块
  • VFS : 虚拟端口
  • Glusterd : 服务

模块化堆栈架构

  • 模块化、堆栈式的架构
  • 通过对模块的组合,实现负责的功能

GlusterFS工作模式

GlusterFS工作流程

  • Application:客户端或应用程序通过GlusterFSync的挂载点访问数据
  • VFS:linux系统内核通过VFS API收到请求并处理
  • FUSE : VFS 将数据递交给FUSE内核文件系统,fuse文件系统则是将数据通过/dev/fuse设备文件递交给了GlusterFS client端
  • GlusterFS Client ; 通过网络将数据传递至远端的GlusterFS Server,并且写入到服务器存储设备上

弹性HASH算法

  • 通过HASH算法得到一个32位的整数
  • 划分为N个连续的子空间,每个空间对应一个Brick
  • 弹性HASH算法的优点
    • 保证数据平均分布在每一个Brink中
    • 解决了对元数据服务器的依懒,进而解决了单点故障以及访问瓶颈

GlusterFS的卷类型

分布式卷

  • 没有对文件进行分块处理
  • 通过扩展文件属性保存HASH值
  • 支持底层文件系统有ext3、ext4、ZFS、XFS等

分布式卷的特点

  • 文件分布在不同的服务器。不具备冗余性
  • 更容易和廉价地扩展卷的大小
  • 单点故障会造成数据丢失
  • 依懒底层的数据保护

创建分布式卷

  • 创建一个名为dis-volume的分布式卷,文件将根据HASH分布在server1:/dir1、server2:/dir2和server3:/dir3中
    gluster volume create dis-volume server1:/dir1 server2:/dir2

条带卷

  • 根据偏移量将文件分为N块(N个条带节点),轮询的存储在每个Brick Server节点
  • 存储大文件时,性能尤为突出
  • 不具备冗余性,类似Raid0

特点

  • 数据被分割成更小块分布到块服务器群中的不同条带区
  • 分布减少负载且更小的文件加速了存取的速度
  • 没有数据冗余

创建条带卷

  • 创建一个名为Stripe-volume的条带卷,文件将被分块轮询的存储在Server1:/dir1和Server2:dir2两个Brick中
    gluster volume create stripe-volume stripe 2 transport tcp server1:/dir1 server2:/dir2

复制卷

  • 同一个文件保存一份或多分副本
  • 复制模式因为保存副本,所以磁盘利用率较低
  • 多个节点的存储空间不一致,那么将按照木桶效应取最低节点的容量作为该卷的总容量

特点

  • 卷中所有的服务器均保存一个完整的副本
  • 卷的副本数量可以有客户创建的时候决定
  • 至少由两个块服务器或更多服务器
  • 具备冗余性

创建复制卷

  • 创建名为rep-volume的复制卷、文件将同时存储两个副本
    gluster volume create rep-volume replica 2 transport tcp server1:/dir1 server2:/dir2

分布式条带卷

  • 兼顾分布式卷和条带卷的功能
  • 主要用于大文件访问处理
  • 至少最少需要4台服务器

创建分布式条带卷

  • 创建一个名为dis-stripe的分布式条带卷,配置分布式的条带卷时,卷中Brink所包含 的存储服务器数必须是条带数的倍数(>=2倍)
    gluster volume create rep-volume stripe 2 transport tcp server1:/dir1 server2:/dir2 server3:/dir1 server4:/dir2

分布式复制卷

  • 兼顾分布式卷和复制卷的功能
  • 用于需要冗余的情况下

创建分布式复制卷

  • 创建一个名为dis-rep的分布式条带卷,配置分布式条带卷的复制卷时,卷中Brink所包含的存储服务器必须是条带数的倍数(>=2倍)
    gluster volume create rep-volume replica 2 transport tcp server1:/dir1 server2:/dir2 server3:/dir1 server4:/dir2

原文地址:https://blog.51cto.com/14473285/2461885

时间: 2024-07-30 10:05:38

GFS分布式文件系统集群(理论篇)的相关文章

GFS分布式文件系统集群(实例!!!)

GFS分布式文件系统集群项目 群集环境 卷类型 卷名称 卷类型 空间大小 Brick dis-volume 分布式卷 40G node1(/b1).node2(/b1) stripe-volume 条带卷 40G node1(/c1).node2(/c1) rep-volume 复制卷 20G node3(/b1).node4(/b1) dis-stripe 分布式条带卷 40G node1(/d1).node2(/d1).node3(/d1).node4(/d1) dis-rep 分布式复制卷

Moosefs分布式文件系统集群讲解配置

1 管理服务器(master-server):负责各个数据存储服务器的管理,文件读写调度,文件空间回收以及恢复.多节点拷贝 2 元数据日志服务器(changelog-server): 负责备份master服务器的变化,(一般情况下可以和管理服务器放在一起)文件类型为changelog_ml.*.mfs,以便于在master server出问题的时候接替其进行工作 3数据存储服务器(chunk-server):负责连接管理服务器,听从管理服务器调度,提供存储空间,并为客户提供数据传输. 4客户端(

FastDFS分布式文件系统集群安装

文档修订记录 跟踪服务器: Tracker Server1 IP:  10.10.16.201 FASTDFS-TRACKER-01 Tracker Server2 IP:  10.10.16.202 FASTDFS-TRACKER-02 存储服务器: Storage Server1 IP:  10.10.16.203 FASTDFS-STORAGE-01 Storage Server2 IP:  10.10.16.204 FASTDFS-STORAGE-02 集群中各操作系统环境设置: (1)

FastDFS分布式文件系统集群

环境 ip fastdfs-role 192.168.1.115 Tracker +Storage 192.168.1.104 Tracker +Storage 192.168.1.106 Tracker +Storage FastDFS安装配置 安装开发环境 # yum groupinstall "Development Tools" "Server platform Development" -y 安装libfastcommon # git clone http

基于外部ZooKeeper的GlusterFS作为分布式文件系统的完全分布式HBase集群安装指南

(WJW)基于外部ZooKeeper的GlusterFS作为分布式文件系统的完全分布式HBase集群安装指南 [X] 前提条件 服务器列表: 192.168.1.84 hbase84 #hbase-master 192.168.1.85 hbase85 #hbase-regionserver,zookeeper 192.168.1.86 hbase86 #hbase-regionserver,zookeeper 192.168.1.87 hbase87 #hbase-regionserver,z

Infortrend CS分布式NAS集群强项之---成本篇

1.专用模式,实现90%空间利用率纠删码及副本模式是在分布式存储系统中广泛应用的横向扩展模式,副本模式存储空间损耗最大,其次纠删码模式,但Infortrend自主研发的专用扩展模式,优于前两者,能最大化的实现高IO吞吐率,将空间利用率提升至90%,RAID空间占比小,剩余可用空间多,也就间接减少了硬件采购需求,成为节约成本的一大助力.2.三重混合系统模式.按需选用Infortrend CS又可称之为"三重混合式"集群,在同一集群系统中纠删码.副本.专用三种模式同时使用,客户根据业务需求

RHCS集群理论暨最佳实践

RHCS集群理论暨 最佳实践 什么是集群?     集群是一组(>2)相互独立的,通过高速网络互联的计算机组成的集合.群集一般可以分为科学集群,负载均衡集群,高可用性集群三大类.     科学集群是并行计算的基础.它对外就好象一个超级计算机,这种计算机内部由十至上万个独立处理器组成,并且在公共消息传递层上进行通信以运行并发应用程序,像中国的银河,曙光超级计算机.     高可用性集群,当集群中的一个系统发生故障时,集群软件迅速作出反应,将该系统的任务分配至集群中其它正在工作的系统上执行,通过消除

分布式服务器集群架构方案思考

nginx-reverse-proxy-conf 研究了一套完整的分布式服务器集群架构方案. 0x01.大型网站演化 简单说,分布式是以缩短单个任务的执行时间来提升效率的,而集群则是通过提高单位时间内执行的任务数来提升效率. 集群主要分为:高可用集群(High Availability Cluster),负载均衡集群(Load Balance Cluster,nginx即可实现),科学计算集群(High Performance Computing Cluster). 分布式是指将不同的业务分布在

分享在Linux下使用OSGi.NET插件框架快速实现一个分布式服务集群的方法

在这篇文章我分享了如何使用分层与模块化的方法来设计一个分布式服务集群.这个分布式服务集群是基于DynamicProxy.WCF和OSGi.NET插件框架实现的.我将从设计思路.目标和实现三方面来描述. 1 设计思路 首先,我来说明一下设计思路.我们先来看看目前OSGi.NET插件框架的服务.在这里,服务不是远程服务,它是轻量级的服务,由接口和实现类组成,如下图所示.服务契约插件定义了服务接口,服务实现插件向服务总线注册服务,服务调用插件利用服务契约(接口)从服务总线获取实现的服务并调用,服务实现