Raid5两块硬盘离线解决方案 -阵列数据恢复案例

#服务器数据恢复背景描述:
需要进行数据恢复的磁盘阵列是两组分别由4块600G容量的SAS硬盘组成的raid5磁盘阵列,ext3文件系统、lvm结构。
磁盘阵列中1号硬盘离线,热备盘启动同步,在同步过程中同raid中3号硬盘故障掉线,该组Raid阵列崩溃,LVM结构不完整,文件系统无法正常使用,服务器瘫痪。管理员检查了掉线的两块硬盘,1号硬盘无法识别,3号硬盘可以识别。

磁盘阵列数据恢复方案:

首先对故障硬盘进行修复,这一步需要借助数据恢复软件对故障硬盘进行备份,然后将raid阵列中未掉线的所有硬盘和另一组正常的raid阵列进行全盘备份。
然后工程师分析raid中的相关信息,根据raid信息重新组建阵列,找到LVM信息,重组LVM卷,再进一步分析EXT3文件系统,恢复并导出全部数据。

数据恢复过程:

1、首先由硬件数据恢复工程师对无法识别的1号硬盘记性开盘检测,硬盘盘片磨损非常严重,无法进行数据恢复,在后续的数据恢复过程中只能按照缺盘状态进行处理。
2、借助数据恢复软件对掉盘raid阵列和正常阵列全部进行全盘备份,数据备份情况如下:

3、根据备份数据对原raid磁盘阵列中的校验方式、条带大小,硬盘盘序等信息进行分析,并根据分析的得出的raid信息重组出两组raid阵列。重组raid截图如下:

4、工程师将两组raid重组完成后开始分析底层数据,尝试分析出lvm结构相关信息并导出作为pv的lun,借助数据恢复软件重组pv并重新生成lvm逻辑卷,过程如下:

5、LVM重组之后,对LV(逻辑卷)中的EXT3文件系统进行解析,恢复并导出其中的全部数据。数据恢复结果如下:


raid数据恢复结果:

由于阵列中的1号硬盘盘片划伤严重无法修复,且部分硬盘中存在坏道,raid结构中可能存在缺陷,但大部份文件经验证后恢复成功。

原文地址:http://blog.51cto.com/sun510/2096989

时间: 2024-12-18 20:13:40

Raid5两块硬盘离线解决方案 -阵列数据恢复案例的相关文章

raid5两块硬盘离线数据恢复案例

Riad数据恢复故障概述 北京某公司的一台存储挂载了raid5磁盘阵列,正常使用中存储忽然崩溃,经管理员检查发现raid5阵列中有两块硬盘离线,阵列中共两块热备盘其中一块热备盘激活失败,raid5阵列瘫痪导致存储无法使用.需要进行基于raid5磁盘阵列的数据恢复操作. Raid5阵列数据恢复检测: 硬件工程师首先对raid中两块离线硬盘进行物理检测,硬盘无物理故障,无坏道.该存储上层共一个lun用于sun小机使用,ZFS文件系统. Raid5阵列数据恢复过程 1.备份数据按照数据恢复流程对所有磁

数据恢复过程之:服务器raid5两块硬盘离线数据恢复

服务器故障情况简介:客户的一台ibm x3850服务器上组了一个raid5磁盘阵列,有两块硬盘离线,服务器崩溃.北亚数据恢复中心工程师对服务器进行初检,客户的磁盘阵列由5块硬盘组成,linux redhat 5.3操作系统,存储一个oracle数据库.阵列中有两块硬盘处于离线状态,热备盘未激活.硬盘无物理故障,无明显同步表现.数据恢复方案:1.关闭服务器同时确保在恢复过程中不再开启服务器,将故障盘进行标记后取出槽位挂载至数据恢复公司的备份服务器环境进行镜像备份.完成后恢复原故障服务器.2.分析备

HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据方案

故障描述 HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存储空间由8块450GB SAS的硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用. 由于存储是因为RAID阵列中某些磁盘掉线,从而导致整个存储不可用.因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障.接着使用坏道检测工具检测磁盘坏道,发现也没有坏道. 解决方法:

HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据过程

故障描述 HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存储空间由8块450GB SAS的硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用. 由于存储是因为RAID阵列中某些磁盘掉线,从而导致整个存储不可用.因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障.接着使用坏道检测工具检测磁盘坏道,发现也没有坏道. 解决方法:

服务器raid5两块硬盘离线vxfs文件系统恢复数据方法

服务器数据恢复故障描述客户的服务器共有8块450GB SAS硬盘,其中7块硬盘组成一个RAID5阵列,1块热备盘.阵列中2块硬盘损坏并离线,导致RAID5阵列瘫痪,进而影响上层LUN无法正常使用.硬盘无物理故障,无坏道.对服务器raid数据恢复过程:1.备份数据使用dd命令或数据恢复工具将所有磁盘镜像成文件.图一:2.分析RAID组结构服务器的LUN都是基于RAID组的,所以需要先对底层RAID组的信息作出分析,再依据这些数据重构原始的RAID组.通过分析得知4号盘为hot Spare盘.继续分

Dell 2850服务器磁盘阵列两块硬盘离线恢复过程

服务器故障描述: 客户使用Dell 2850服务器组建了raid5磁盘阵列,阵列中包含有6块硬盘(SCSI硬盘,单盘容量300G),服务器操作系统为linux Redhat4:文件系统为ext3文件系统.在使用过程中服务器瘫痪,管理员对阵列检查后发现有两块硬盘离线,对其中一块硬盘进行了强制上线操作,但操作系统启动异常.管理员此时意识到事情的严重程度,马上对服务器进行关机,然后联系到数据恢复中心进行数据恢复. 数据恢复中心初检结论: 在服务器数据恢复工作中,raid5两块硬盘离线的情况十分常见,由

EMC FC AX-4存储两块硬盘离线数据恢复方法和数据恢复过程

服务器故障描述:山西某公司一台服务器的EMC FC AX-4存储RAID5磁盘阵列,阵列中共有12块硬盘组成raid5磁盘阵列其中有两块硬盘为热备盘,阵列中硬盘单盘容量为1TB,服务器中有两块硬盘离线,一块热备盘未启用.客户将服务器中所有磁盘带到数据恢复公司.通常情况下造成服务器硬盘离线的原因为磁盘物理故障或者硬盘坏道.但是由于EMC控制器有着十分严格的磁盘检查策略,容易将性能不稳定的硬盘判定为硬件故障提出raid组,所以导致服务器崩溃的原因也有可能是磁盘读写不稳定.服务器数据恢复解决过程:第一

服务器两块硬盘离线能否强制上线恢复

磁盘阵列两块硬盘离线数据恢复案例一: 客户的一台服务器因为未知的原因导致一块硬盘红灯闪亮,不过服务器还在正常运行,管理员未做处理,随后该服务器内的另一块硬盘出现同样的报警提示,服务器崩溃.数据恢复工程师对该磁盘阵列数据恢复过程如下(下列操作有风险,请备份后再操作):1.将服务器启动,服务器自检时手动进入管理程序查看raid磁盘阵列情况,发现硬盘的状态为Failel,手动将其中一块离线硬盘重新设置为online状态后尝试重启服务器但重启失败.2.将该硬盘重新Fail掉,重复上次的操作步骤将另一块硬

HP P2000 RAID-5两块盘离线的数据恢复报告

1. 故障描述 本案例是HP P2000的存储vmware exsi虚拟化平台,由RAID-5由10块lT硬盘组成,其中6号盘是热备盘,由于故障导致RAID-5磁盘阵列的两块盘掉线,表现为两块硬盘亮黄灯. 经用户方维护人员检测,故障硬盘应为物理故障,表现为:序列号无法读取,在SAS扩展卡上硬盘无法识别. 2. 数据备份与修复 故障发生后用户方工程师与我公司联系,经过详细咨询,了解到故障比较严重,必须把RAID-5磁盘阵列带到我公司进行检测,检测RAID-5的每块成员盘是物理故障(磁头损坏或者盘片