GlusterFS复制卷修复功能测试分析--brick文件丢失

0、测试环境

GlusterFS 3.6.4/3.6.7/3.6.9

CentOS 6.7/7.1


1、测试用例及结果一

假设A、B副本主机,C客户机,C挂载到A。

先通过C在卷中创建1到99文件。

测试一:

A上删除 rm -f 2*,A执行heal full,看是否恢复,如果不行,再在B上执行heal full,A上看文件是否恢复。操作期间不要在C上ls。

A上删除 rm -f 3*,只在C上ls,C上看是否有3*,A上看是否恢复。

测试二:

A上删除 rm -f 4*,同时删除对应gfid文件。A执行heal full,看是否恢复,如果不行,再在B上执行heal full,A上看文件是否恢复。操作期间不要在C上ls。

A上删除 rm -f 5*,同时删除对应gfid文件。只在C上ls,C上看是否有5*,A上看是否恢复。

测试三:

B上删除 rm -f 6*,A执行heal full,看是否恢复,如果不行,再在B上执行heal full,B上看文件是否恢复。操作期间不要在C上ls。

B上删除 rm -f 7*,只在C上ls,C上看是否有7*,B上看是否恢复。

测试四:

B上删除 rm -f 8*,同时删除对应gfid文件。A执行heal full,看是否恢复,如果不行,再在B上执行heal full,B上看文件是否恢复。操作期间不要在C上ls。

B上删除 rm -f 9*,同时删除对应gfid文件。只在C上ls,C上看是否有9*,B上看是否恢复。

测试结果:

实验一

可以C 上可以看到3* 其它都不行

实验二

可以C 上可以看到5* 其它都不行

实验三

1. 可以恢复6*

2. B上没有恢复 且C看不到7*

实验四

1. 可以恢复8*

2. B上9*没有恢复 且C看不到9*

2、测试用例及结果二

再补充两个测试用例,这两个需要恢复快照,保证环境纯净可靠后再分别执行。

假设A、B副本主机,C客户机,C挂载到A。

先通过C在卷中创建1到99文件。

场景一:

A上删除 rm *,A执行heal full,看是否恢复,如果不行,再在B上执行heal full,A上看文件是否恢复。如果不行再在C上ls,看C上是否能看到文件。

如果还不行,重启A上glusterd服务,然后再执行上述操作看结果。

假设A、B副本主机,C客户机,C挂载到A。

先通过C在卷中创建1到99文件。

场景二:

B上删除 rm *,同时删除对应gfid文件。A执行heal full,看是否恢复,如果不行,再在B上执行heal full,B上看文件是否恢复。如果不行再在C上ls,看C上是否能看到文件。

如果还不行,重启B上glusterd服务,然后再执行上述操作看结果。

测试结果:

场景一

C上看到文件,其它都不行

场景二

都不行

3、测试总结-副本文件丢失修复

当复制卷中的副本文件被不小心删除(同时删除对应的gfid文件)后,可以通过

gluster volume heal VOLNAME full

命令来修复,如果不加full参数,则不会检测到丢失的副本,不进行副本修复操作。

当一个副本丢失后,客户端可能看到丢失的文件,也可能看不到丢失的文件,取决于挂载的主机位置。

当仍能看到丢失的文件时:

虽然能看到丢失的文件,但此时的ls或ls -l并不能恢复副本,当再次对丢失的文件进行修改操作时,副本文件才会被修复。

当不能看到丢失的文件时:
        1)重新挂载会修复丢失的副本,修复后,客户端可以看到全部文件。显然线上系统通常不能这样操作。

2)后台执行gluster volume heal VOLNAME full命令可以修复丢失副本文件,同时让客户端再次看到丢失的文件。

暗文件说明

在复制卷情况下,假设有两个brick做成的volume,当在其中一个brick上删除一个文件file(不删除对应的gfid文件)时,有可能导致(两个副本,删除其中一个副本会导致,但具体哪个副本暂不确定,也有可能是非挂载点的副本)客户端看不到该文件,此时的情况是:

客户端看不到file;其中一个brick上有file;另外一台上无file。

此时,执行gluster volume heal full自我修复操作,效果和上面描述一样,客户端无法看到该文件,此时的file称之为暗文件。

客户端重新挂载法修复(有时重新挂载可以修复,需要考虑最坏情况)。

服务器端heal full无法修复。

如何恢复暗文件?

  1. 在客户端执行ls file操作。此时服务器端的file也会自动恢复。

    1. 这样做的前提是,必须知道丢失的文件名,否则无法恢复。
    2. 未恢复前,客户端对file进行touch、写等操作都能正常进行,当执行一次后,服务端文件会自动恢复,前提还是必须知道文件名。
  2. 服务器端之利用用cp机制恢复。
  3. 客户端重新挂载法修复(有时重新挂载可以修复,需要考虑最坏情况)。

出现暗文件是非常糟糕的事情,在线上很难确定哪些副本丢失,重新挂载基本也是不予许的,所以要尽量避免此类情况出现。

时间: 2024-08-06 03:47:11

GlusterFS复制卷修复功能测试分析--brick文件丢失的相关文章

GlusterFS复制卷修复原理以及脑裂分析

裂脑 所谓脑裂,就是指两个或多个节点都"认为"自身是正常节点而互相"指责"对方,导致不能选取正确的节点进行接管或修复,导致脑裂状态.这种现象出现在数据修复.集群管理等等高可用场景. Glusterfs的冗余镜像(下文简称AFR)提供了数据副本功能,能够在即使只有一个冗余节点的情况下仍能正常工作,不中断上层应用.当节点恢复后,能够将数据修复到一致状态,保证数据的安全. AFR工作原理 AFR数据修复主要涉及三个方面:ENTRY,META,DATA,我们以冗余度为2即含

glusterfs复制卷的创建以及glusterfs的常用命令

一.           安装glusterfs服务端 1.  到阿里云取epel源,和官方的yum源才能安装.(本次把几个个yum源放到附件) yuminstall glusterfs-server装完即可 启动glusterd [[email protected]]# systemctl start glusterd [[email protected]]# ps -ef | grep gluster root      4732    1  0 16:22 ?        00:00:0

GlusterFS六大卷模式說明

GlusterFS六大卷說明 第一,分佈卷 在分布式卷文件被随机地分布在整个砖的体积.使用分布式卷,你需要扩展存储,冗余是重要或提供其他硬件/软件层.(簡介:分布式卷,文件通过hash算法随机的分布到由bricks组成的卷上.卷中资源仅在一台服务器上存储,在存储池中非镜像或条带模式.) (In a distributed volumes files are spread randomly across the bricks in the volume. Use distributed volum

【转载】GlusterFS六大卷模式說明

本文转载自翱翔的水滴<GlusterFS六大卷模式說明> GlusterFS六大卷說明 第一,分佈卷 在分布式卷文件被随机地分布在整个砖的体积.使用分布式卷,你需要扩展存储,冗余是重要或提供其他硬件/软件层.(簡介:分布式卷,文件通过hash算法随机的分布到由bricks组成的卷上.卷中资源仅在一台服务器上存储,在存储池中非镜像或条带模式.) (In a distributed volumes files are spread randomly across the bricks in the

复制指定目录下的指定文件,并修改后缀名 很重要,也很难!!!

package cn.idcast2; import java.io.BufferedInputStream; import java.io.BufferedOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.FilenameFilter; im

[性能分析]linux文件描述符(转)

1.什么是文件和文件描述符 Linux中文件可以分为4种:普通文件.目录文件.链接文件和设备文件.1.普通文件是用户日常使用最多的文件,包括文本文件.shell脚本.二进制的可执行和各种类型的数据.ls -lh 来查看某个文件的属性,可以看到有类似 -rw-r--r-- ,值得注意的是第一个符号是 - ,这样的文件在Linux中就是普通文件.这些文件一般是用一些相关的应用程序创建,比如图像工具.文档工具.归档工具... .... 或 cp工具等.这类文件的删除方式是用rm 命令:2.目录文件在l

实例分析ELF文件动态链接

参考文献: <ELF V1.2> <程序员的自我修养---链接.装载与库>第6章 可执行文件的装载与进程 第7章 动态链接 <Linux GOT与PLT> 开发平台: [[email protected] dynamic_link]# uname -a Linux tanghuimin 2.6.32-358.el6.x86_64 #1 SMP Fri Feb 22 00:31:26 UTC 2013 x86_64 x86_64 x86_64 GNU/Linux 实例讲解

[性能分析]linux文件描述符

1.什么是文件和文件描述符 Linux中文件可以分为4种:普通文件.目录文件.链接文件和设备文件.1.普通文件是用户日常使用最多的文件,包括文本文件.shell脚本.二进制的可执行和各种类型的数据.ls -lh 来查看某个文件的属性,可以看到有类似 -rw-r--r-- ,值得注意的是第一个符号是 - ,这样的文件在Linux中就是普通文件.这些文件一般是用一些相关的应用程序创建,比如图像工具.文档工具.归档工具... .... 或 cp工具等.这类文件的删除方式是用rm 命令:2.目录文件在l

分析日志文件

在tomcat中安装logback插件,此插件用于生成日志.该日志中包括很多信息,我们的目的是将需要的数据进行整理,将其插入到MySQL数据库中,并将其做成定时任务执行. 一下是原日志文件内容: 我们需要client,uniquecode,device,versioncode,interface,createtime这些字段 思路如下: 1.我们只需要对包含接口和请求开始字段的行进行数据整理. grep "personal/checkupdate.json请求开始"   /home/l