服务器RAID6三块硬盘离线 数据丢失的恢复过程

小编我最近参与了一例非常成功的数据恢复的案例,在这里分享给大家。用户是一组6块750G磁盘的 RAID6,先后有两块磁盘离线,但维护人员在此情况下依然没有更换磁盘,所以在第三块硬盘离线后raid直接崩溃了。由此导致数据全部丢失。

这台服务器是WEB服务器,运行MYSQL数据库,同时存放了大量其它文件,管理员在数据丢失后便第一时间寻求数据恢复公司的帮助,但是经过某公司的操作后仍有近一个月的文件损坏或丢失,MYSQL数据库也严重损坏。后来经其它运维人员的介绍,这位管理员同志就联系到了我们。

了解了故障的基本情况以后,我们的工程师先将这6块磁盘镜像备份到我们的安全存储池中,就不再对原存储进行任何的操作,这样就保障了客户数据的原始性。

通过对备份镜像的分析,我们发现有两块磁盘离线时间很早,最新的数据已经不再写入。此RAID6用的是双校验,第一个校验是由普通的XOR运算生成,而第二个校验是由Reed-Solomon算法生成,相当复杂,运用了相当奇妙的数学原理。此RAID6有两块磁盘早已不写入新数据,要想完整恢复数据就必须运用第二个校验,否则会导致最新的数据丢失或损坏。目前市面上还没有公开的数据恢复软件能解决这个问题,虽然有部分软件设有这一功能,但不过是摆设而已,实则无法使用。这也就是其他公司并没能够完整的恢复所有数据的根本原因所在。

工程师分析出原始RAID的一些参数,然后使用了我们自己写的完全RAID6恢复软件,生成出一个完整镜像,再将镜像导回客户用新磁盘搭好的存储上,开机,一切正常,经过管理员的验证,数据没任何问题。

后记:

重要数据要做好数据备份工作,做好病毒防护工作,发现数据丢失后一定要保护好故障硬盘。寻找数据恢复公司最好是找一些专业数据恢复公司,可以最大程度保障数据恢复的成功率。

时间: 2024-10-06 06:11:34

服务器RAID6三块硬盘离线 数据丢失的恢复过程的相关文章

raid6三块硬盘离线应该怎么恢复数据?磁盘阵列数据恢复方法

需要进行数据恢复的磁盘阵列是在一所高校里,首先简单介绍一下发生故障的这台设备具体情况:需要进行数据恢复的设备是一组由6块硬盘(容量为750G)组成的raid6,现在有3块硬盘为离线状态,raid崩溃.服务器是web服务器,主要运行的MySQL数据库以及存放大量的其他文件全部数据丢失,急需进行raid数据恢复.由于在我们接手到客户设备之前已经由其他公司进行过一次raid数据恢复工作,但数据并没有完全恢复,数据库也损坏严重,数据恢复工作失败.所以我们接到这6块磁盘后第一件事就是把这组raid的6块磁

服务器raid5两块硬盘离线vxfs文件系统恢复数据方法

服务器数据恢复故障描述客户的服务器共有8块450GB SAS硬盘,其中7块硬盘组成一个RAID5阵列,1块热备盘.阵列中2块硬盘损坏并离线,导致RAID5阵列瘫痪,进而影响上层LUN无法正常使用.硬盘无物理故障,无坏道.对服务器raid数据恢复过程:1.备份数据使用dd命令或数据恢复工具将所有磁盘镜像成文件.图一:2.分析RAID组结构服务器的LUN都是基于RAID组的,所以需要先对底层RAID组的信息作出分析,再依据这些数据重构原始的RAID组.通过分析得知4号盘为hot Spare盘.继续分

数据恢复过程之:服务器raid5两块硬盘离线数据恢复

服务器故障情况简介:客户的一台ibm x3850服务器上组了一个raid5磁盘阵列,有两块硬盘离线,服务器崩溃.北亚数据恢复中心工程师对服务器进行初检,客户的磁盘阵列由5块硬盘组成,linux redhat 5.3操作系统,存储一个oracle数据库.阵列中有两块硬盘处于离线状态,热备盘未激活.硬盘无物理故障,无明显同步表现.数据恢复方案:1.关闭服务器同时确保在恢复过程中不再开启服务器,将故障盘进行标记后取出槽位挂载至数据恢复公司的备份服务器环境进行镜像备份.完成后恢复原故障服务器.2.分析备

Dell 2850服务器磁盘阵列两块硬盘离线恢复过程

服务器故障描述: 客户使用Dell 2850服务器组建了raid5磁盘阵列,阵列中包含有6块硬盘(SCSI硬盘,单盘容量300G),服务器操作系统为linux Redhat4:文件系统为ext3文件系统.在使用过程中服务器瘫痪,管理员对阵列检查后发现有两块硬盘离线,对其中一块硬盘进行了强制上线操作,但操作系统启动异常.管理员此时意识到事情的严重程度,马上对服务器进行关机,然后联系到数据恢复中心进行数据恢复. 数据恢复中心初检结论: 在服务器数据恢复工作中,raid5两块硬盘离线的情况十分常见,由

EMC FC AX-4存储两块硬盘离线数据恢复方法和数据恢复过程

服务器故障描述:山西某公司一台服务器的EMC FC AX-4存储RAID5磁盘阵列,阵列中共有12块硬盘组成raid5磁盘阵列其中有两块硬盘为热备盘,阵列中硬盘单盘容量为1TB,服务器中有两块硬盘离线,一块热备盘未启用.客户将服务器中所有磁盘带到数据恢复公司.通常情况下造成服务器硬盘离线的原因为磁盘物理故障或者硬盘坏道.但是由于EMC控制器有着十分严格的磁盘检查策略,容易将性能不稳定的硬盘判定为硬件故障提出raid组,所以导致服务器崩溃的原因也有可能是磁盘读写不稳定.服务器数据恢复解决过程:第一

服务器两块硬盘离线能否强制上线恢复

磁盘阵列两块硬盘离线数据恢复案例一: 客户的一台服务器因为未知的原因导致一块硬盘红灯闪亮,不过服务器还在正常运行,管理员未做处理,随后该服务器内的另一块硬盘出现同样的报警提示,服务器崩溃.数据恢复工程师对该磁盘阵列数据恢复过程如下(下列操作有风险,请备份后再操作):1.将服务器启动,服务器自检时手动进入管理程序查看raid磁盘阵列情况,发现硬盘的状态为Failel,手动将其中一块离线硬盘重新设置为online状态后尝试重启服务器但重启失败.2.将该硬盘重新Fail掉,重复上次的操作步骤将另一块硬

raid5两块硬盘离线数据恢复案例

Riad数据恢复故障概述 北京某公司的一台存储挂载了raid5磁盘阵列,正常使用中存储忽然崩溃,经管理员检查发现raid5阵列中有两块硬盘离线,阵列中共两块热备盘其中一块热备盘激活失败,raid5阵列瘫痪导致存储无法使用.需要进行基于raid5磁盘阵列的数据恢复操作. Raid5阵列数据恢复检测: 硬件工程师首先对raid中两块离线硬盘进行物理检测,硬盘无物理故障,无坏道.该存储上层共一个lun用于sun小机使用,ZFS文件系统. Raid5阵列数据恢复过程 1.备份数据按照数据恢复流程对所有磁

服务器数据恢复案例 / raid5阵列多块硬盘离线处理方法

服务器数据恢复案例一: 某研究院 DELL服务器 磁盘阵列崩溃,内置15块1TB硬盘搭建的RAID5阵列.一开始有一块硬盘离线,在更换新硬盘进行同步的过程中,第二块磁盘指示灯报警,同步失败,阵列无法正常工作.服务器数据恢复检测:最先离线的硬盘访问速度极其缓慢,第二块离线的磁盘有少量坏扇区,其他磁盘无明显物理问题.服务器质逻辑状况:整个阵列只包含一个卷组,该卷组占用阵列全部空间:并且该卷组只有一个起始位置为0扇区的XFS裸分区.制定服务器数据恢复方案:RAID5阵列架构在设计上只支持一块磁盘的错误

HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据方案

故障描述 HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存储空间由8块450GB SAS的硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用. 由于存储是因为RAID阵列中某些磁盘掉线,从而导致整个存储不可用.因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障.接着使用坏道检测工具检测磁盘坏道,发现也没有坏道. 解决方法: