如果RAID阵列崩溃你能想到哪些好的补救方式,学会这一步颠覆你以往认知。

一、存储故障概述
1、故障环境

两组分别由4块600G容量的SAS硬盘组成的raid5阵列,并且两组阵列划分LUN,组成LVM结构,并格式化为EXT3文件系统。
2、故障分析
一块硬盘意外离线,热备盘上线,顶替离线硬盘。但在热备盘上线过程中,又一块硬盘离线,导致热备盘同步失败,两组raid阵列中的一组崩溃,LVM结构不完整,文件系统无法正常使用。对两块离线硬盘进行检测,发现先离线硬盘无法识别,初步推断是硬件故障,需要进行开盘修复操作,另一块硬盘可以识别。
二、解决方案概述
根据前期的故障分析结果,总结出以下解决方案:
1、对故障硬盘进行修复,使用MRT专业数据恢复软件对故障硬盘进行备份。
2、使用专业数据恢复软件winhex对raid其余成员盘和另一组raid全部成 员盘进行全盘备份。
3、分析每个硬盘的数据,根据分析的结构重组RAID 阵列。
4、分析重组完的阵列,找到LVM信息,重组LVM卷。
5、对重组的LVM卷上的EXT3文件系统进行解析,恢复并导出全部数据。
三、实施解决方案
1、故障盘修复
对故障硬盘进行开盘修复操作。开盘后发现,硬盘盘片磨损严重,已无法修复,只能对阵列进行缺盘处理。
2、硬盘备份
使用专业数据恢复软件winhex对故障raid阵列的其余成员盘进行全盘备份,并且对另一组好的raid阵列的全部成员盘进行全盘备份,备份情况如下:


3、重组raid阵列
仔细分析硬盘底层数据,通过对EXT3文件系统结构进行解析,分别分析出两组raid阵列的盘序、条带大小、校验方向等配置信息,使用专业数据恢复软件winhex重组出两组raid阵列。经分析,两组raid阵列块大小都为64K,校验方向为做同步,对故障raid进行重组时注意进行缺盘处理。


4、重组LVM结构
重组出两组raid阵列之后,对两组raid中的底层数据进行分析,找到LVM结构信息,对LVM结构进行分析,将两组raid中作为PV(LVM物理卷)的LUN导出,然后使用专业数据恢复软件UFS Explorer将两个PV重组,重新生成LVM逻辑卷。


5、恢复数据
LVM重组之后,对LV(逻辑卷)中的EXT3文件系统进行解析,恢复并导出其中的全部数据。以下为回复出来的数据:

四、数据校验
对恢复出来的数据,挑选部分压缩文件等进行校验,发现部分文件损坏,对解析结果和恢复结果对比,发现部分文件损坏且无法恢复。经过分析,初步推断文件损坏与两组raid中部分硬盘存在坏道有关。以下为两组raid中部分硬盘坏道情况:
Raid 1:2# 67 bad source sectors encountered.
4# 13 bad source sectors encountered.
Raid 2:2# 37 bad source sectors encountered.
五、恢复结论
由于故障硬盘损坏严重,硬件无法修复,并且部分硬盘存在坏道,导致raid结构中可能存在缺陷,部分文件损坏,但大部份文件经验证后恢复成功,只有小部分文件丢失或者损坏,本次数据恢复成功完成。

原文地址:https://blog.51cto.com/sun510/2422336

时间: 2024-07-30 01:19:50

如果RAID阵列崩溃你能想到哪些好的补救方式,学会这一步颠覆你以往认知。的相关文章

raid阵列崩溃后对物理硬盘做完整镜像的步骤

磁盘阵列(DiscArray)是由许多台磁盘机或光盘机按一定的规则,如分条(Striping).分块(Declustering).交叉存取(Interleaving)等组成一个快速,超大容量的外存储器子系统.它在阵列控制器的控制和管理下,实现快速,并行或交叉存取,并有较强的容错能力.从用户观点看,磁盘阵列虽然是由几个.几十个甚至上百个盘组成,但仍可认为是一个单一磁盘,其容量可以高达几百-上千千兆字节,因此这一技术广泛为多媒体系统所欢迎.因此raid阵列数据恢复的市场需求也很大,本文主要为大家详细

定制带RAID阵列卡驱动的WINPE3.0系统

最近一个朋友的服务器出现了问题,经了解他的服务器是组装的,且配置了RAID5阵列,目前无法正常启动系统,且中间一盘电源系统掉了,对数据进行了损坏,RAID正在进行数据修复中,但复制完成后发现系统无法启动,且重新安装系统也会报需要格式化磁盘,这时候如果直接安装又怕数据损坏,但是他需要将数据备份出来,于是想到了用WINPE系统,但是就目前而言百度能找到的PE系统都是无RAID阵列卡驱动的,或都阵列卡驱动不对的,为此我需要自己定制一个PE系统来解决这一问题,在这里将PE系统定制的方法说一下,希望以后遇

联想Lenovo服务器RAID阵列数据恢复

服务器作为数据集中存储和管理的地方,一旦其发生故障,会给用户和企业带来非常大数据损失.联想作为目前比较热门的服务器品牌,被很多企业所使用,也伴随着越来越多联想服务器数据恢复问题的出现.其中一种就是服务器raid卡损坏的数据恢复问题.那么,有没有方法能够解决联想Lenovo服务器RAID阵列数据恢复呢? 引起联想服务器数据丢失的常见故障有6种:lenovo联想服务器RAID阵列信息丢失,造成整台服务器无法启动:lenovo联想服务器硬盘一块硬盘掉线,报红灯,系统服务无法启动:将lenovo联想服务

RAID阵列

RAID阵列 一. RAID简介 RAID全称为Redundant Array of Disks,是"独立磁盘冗余阵列"(最初为"廉价磁盘冗余阵列")的缩略语.1987年由Patterson,Gibson和Katz在加州大学伯克利分院的一篇文章中定义.RAID阵列技术允许将一系列磁盘分组,以实现为数据保护而必需的数据冗余,以及为提高读写性能而形成的数据条带分布.RAID最初用于高端服务器市场,不过随着计算机技术的快速发展,RAID技术已经渗透到计算机遍布的各个领域.

博客8:RAID阵列的实现

RAID阵列的组成原理:    1.RAID:Redundant Arrays of Independent Disks 独立冗余磁盘阵列          1)提高IO能力,提高耐用性          2)级别:即多块磁盘组织在一起的工作方式不同          3)RAID实现的方式:                      外接式磁盘阵列:通过扩展适配器提供适配能力                      内接式RAID(软RAID):主板集成RAID控制器          4)

使用RAID阵列卡制作RAID 10 和RAID 5 步骤

公司最近进了几台带有RAID阵列卡的测试机,对于我们公司产品来说,这几台服务器的性能倒是非常不错的了.而我也终于有幸接触到了带有硬件RAID卡的服务器,所以立马倒腾了一下硬RAID的制作. 我选择了其中一台服务器做测试.这里先说一下这台服务器的硬件,当然是我们实验所需要的硬件.服务器带有4块2T的企业级硬盘和1块240G的SSD硬盘,服务器支持板载RAID,当然也有一块带有512M缓存的RAID卡. 我本想使用4块硬盘制作RAID5,这样的话,就可以有7.6T*(3/4)的实际可存储空间,但是在

RAID阵列与LVM逻辑卷组创建

一.Linux下RAID的创建 Linux下使用mdadm命令创建RAID 1.创建模式: -C:新建RAID卷 专用选项: -l:选择RAID级别 -n:硬盘设备个数 -a:自动为其创建设备文件,后跟yes.no -c:指定chunk(数据库)大小,为2的整数次方默认为64K -x:指定空闲盘个数--提供冗余,磁盘损坏后直接加载上去 例:创建raid0 madadm -C /dev/md0 -a yes -l 0 -n 2 /dev/sda{6,7} Mke2fs -j /dev/md0 Mo

raid阵列常见故障解决方案分享

Raid磁盘阵列是一种将多块物理硬盘整合成一个虚拟存储的技术,raid模块相当于一个存储管理中间层,上层接收并执行操作系统及文件系统的数据读写指令,下层管理数据在各个物理硬盘上的存储及读写,相对于单独的物理硬盘,raid可以为用户提供更大的独立存储空间,更快的读写速度,更高的数据存储安全及更方便的统一管理模式.Raid磁盘阵列的正常运转是保障服务器中数据正常读写的关键所在. 服务器raid损坏的常见特征: 1.Raid磁盘阵列中有多快物理硬盘指示灯报警.2.磁盘阵列中显示多块硬盘呈离线状态或丢失

EMC存储raid阵列分区丢失的恢复过程

一.磁盘阵列分区丢失的过程介绍 事情的起因是由于机房的管理员按照规定对机房进行定期维护,结果由于操作失误导致一台某品牌的服务器设备(raid5磁盘阵列)中的分区丢失,丢失的分区中存储了该公司所有生产业务数据,业务因此瘫痪.经数据恢复工程师检测后发现由于该服务器文件系统头部的超级块及部分节点.目录项丢失,根据超级块备份及文件系统中的目录树结构,对超级块进行修复还原,对丢失的节点.目录项进行修补.重构之后,文件系统可以完整恢复.· 二.raid5磁盘阵列数据恢复过程 1.数据恢复工程师接到客户服务器