服务器raid5阵列故障排查及数据恢复过程记录

【服务器故障情况概述】

今天介绍的是服务器raid5阵列因为不明原因导致阵列崩溃后的故障排查方法,以及服务器数据恢复过程。下面简单介绍一下需要恢复数据的服务器硬件配置情况:
本次数据恢复案例中的服务器型号为某品牌X3850型号,服务器上组建了一个raid5磁盘阵列,阵列里包含4块成员盘和1块热备盘一共5块。
服务器再正常使用过成功突然崩溃,管理员查看raid阵列状态时发现阵列中有2块硬盘掉线,热备盘没有启用。需要从服务器层面进行数据恢复操作。
·
【服务器数据恢复普通流程】
首先关闭服务器并保证在排查故障和数据恢复的过程中原始服务器状态不被破坏或变更。
将阵列内所有硬盘明确编码后移除服务器,将硬盘挂载到服务器数据恢复专用存储设备上,对raid5阵列中的所有硬盘做完全镜像后恢复故障服务器状态。
对镜像出的服务器数据进行raid结构分析,通过分析提取到磁盘阵列的raid条带信息、条带分布规律、raid阵列校验方向以及meta区域等基础信息。
得到上述阵列信息后,服务器数据恢复工程师在数据恢复专用服务器上虚拟重组了一个相同的raid5阵列环境,进一步解析虚拟磁盘的文件系统数据。
对分析出来的数据进行验证提取,确认数据正确后使用linux livecd或win pe(通常不支持)等进行数据回迁。

·
【服务器raid5数据恢复过程】
数据恢复工程师对所有硬盘进行镜像后分析raid5结构,经过分析得到最佳结构为0,1,2,3盘序,缺3号盘,块大小512扇区,backward parity(Adaptec),
按照服务器数据恢复普通方法,数据恢复工程师对上述数据进行验证,所有压缩包均可正常解压,结构正确。
按照数据恢复工程师分析到的raid5阵列结构虚拟重组raid阵列,重组后的raid5阵列经过验证未发现任何报错。
对raid5阵列的文件系统进行解析和数据提取,提取数据正常。
经客户服务器管理员对提取出来的数据验证后配合客户管理员将恢复出来的所有数据回迁到客户准备的服务器内。回写后启动操作系统进行最终数据验证。
·
【服务器数据恢复结果】
经过客户服务器管理员验证,服务器raid5阵列内的所有数据恢复完整,数据应用正常,本次数据恢复圆满完成。

原文地址:https://blog.51cto.com/sun510/2472718

时间: 2024-08-06 11:52:47

服务器raid5阵列故障排查及数据恢复过程记录的相关文章

某服务器RAID5阵列数据恢复方案及过程

第一部分:数据恢复方案 [故障描述]:某公司的一台服务器组了一个raid5磁盘阵列有两块磁盘先后掉线,服务器崩溃.故障服务器的操作系统为linux redhat 5.3,应用系统为构架于oracle的一个oa,数据重要,时间很急.因oracle已经不再对本oa系统提供后续支持,用户要求尽可能数据恢复+操作系统复原.[初检结论]:热备盘完全无启用,硬盘无明显物理故障,无明显同步表现.数据通常可恢复[恢复方案]:1.保护原环境,关闭服务器,确保在恢复过程中不再开启服务器.2.将故障硬盘标好序号,确保

服务器SAS硬盘raid5崩溃lvm丢失的数据恢复过程

概述 北京某单位服务器一块硬盘意外离线,热备盘上线,顶替离线硬盘.但在热备盘上线过程中,又一块硬盘离线,导致热备盘同步失败,两组raid阵列中的一组崩溃,LVM结构不完整,文件系统无法正常使用,需要对服务器数据进行修复.对两块离线硬盘进行检测,发现先离线硬盘无法识别,初步推断是硬件故障,需要进行开盘修复操作,另一块硬盘可以识别. 两组分别由4块600G容量的SAS硬盘组成的raid5阵列,并且两组阵列划分LUN,组成LVM结构,并格式化为EXT3文件系统. 解决方案 1.故障盘修复 对故障硬盘进

数据恢复过程之:服务器raid5两块硬盘离线数据恢复

服务器故障情况简介:客户的一台ibm x3850服务器上组了一个raid5磁盘阵列,有两块硬盘离线,服务器崩溃.北亚数据恢复中心工程师对服务器进行初检,客户的磁盘阵列由5块硬盘组成,linux redhat 5.3操作系统,存储一个oracle数据库.阵列中有两块硬盘处于离线状态,热备盘未激活.硬盘无物理故障,无明显同步表现.数据恢复方案:1.关闭服务器同时确保在恢复过程中不再开启服务器,将故障盘进行标记后取出槽位挂载至数据恢复公司的备份服务器环境进行镜像备份.完成后恢复原故障服务器.2.分析备

raid5阵列条带分析 / 磁盘阵列数据恢复方法

1.服务器数据恢复故障描述服务器型号:HP P2000服务器操作系统:VMWARE ESX服务器文件系统:VMFS磁盘阵列级别:RAID-5需要进行数据恢复的服务器挂载了8块硬盘组成RAID-5磁盘阵列,其中4号盘是热备盘,服务器在正常运行中两块硬盘亮黄色故障灯,经用户方维护人员检测,故障硬盘应为物理故障,表现为:序列号无法读取,在SAS扩展卡上硬盘无法识别.需要对raid磁盘阵列进行数据恢复 2.硬盘物理故障修复由于服务器故障情况严重,需要首先确定该组raid阵列的磁盘掉线原因,工程师在接到用

北亚针对服务器RAID5硬盘故障进行数据恢复案例

[基本信息] 服务器型号:IBM X3850服务器, 硬盘型号:73G SAS硬盘, 硬盘数量:5块硬盘 其中4块组成一个RAID5,另一块做为热备盘(Hot-Spare), 操作系统:linux redhat 5.3,应用系统为构架于oracle的一个oa. [故障表现] 3号盘早已经离线,但热备盘未自动激活rebuild(原因不明),之后2号盘离线,RAID崩溃. oracle已经不再对本oa系统提供后续支持,用户要求尽可能数据恢复+操作系统复原. [初检结论] 热备盘完全无启用,硬盘无明显

raid5阵列条带分析和阵列重组过程

1.服务器raid5磁盘阵列故障 服务器型号为P2000服务器/raid5磁盘阵列/10块磁盘/单盘容量1TB/热备盘盘号为6,故障表现为磁盘阵列中2块磁盘离线,提示×××警报灯,初检结果为阵列磁盘序列号不能读取/无法通过扩展卡识别,初步推断磁盘物理故障. 2.raid磁盘阵列数据备份 我公司服务器数据恢复工程师对故障设备进行初检发现该磁盘阵列故障情况复杂,需对正常硬盘和掉线硬盘使用不同的方法进行处理,针对raid阵列中的正常磁盘借助数据恢复软件进行镜像备份即可,存在物理故障的离线硬盘则需要修复

服务器raid5磁盘阵列不同故障导致数据丢失的数据恢复方法(案例)

服务器Raid 5阵列算法 Raid5阵列使用的算法通常被称为"异或运算",这是一个数学运算符.它应用于逻辑运算.异或的数学符号为"⊕",计算机符号为"xor".其运算法则为:a⊕b = (?a ∧ b) ∨ (a ∧?b).如果a.b两个值不相同,则异或结果为1.如果a.b两个值相同,异或结果为0.异或也叫半加运算,其运算法则相当于不带进位的二进制加法:二进制下用1表示真,0表示假,则异或的运算法则为:0⊕0=0,1⊕0=1,0⊕1=1,1⊕1

服务器数据恢复成功案例(raid5阵列故障恢复方法)

服务器数据恢复故障环境: 需要进行数据恢复的服务器型号为IBM DS5300存储设备,包含一个存储机头和多个存储扩展柜,创建了2组RAID 5磁盘阵列.发生故障的阵列组为客户服务器中的3号磁盘柜中的raid5阵列,该阵列共有15块成员盘和1块热备硬盘组成.服务器在使用过程中3号磁盘柜中的11号硬盘离线,由16号热备硬盘替换,进行数据同步,在热备硬盘同步过程中,5号硬盘也因为故障离线,导致数据同步失败,RAID 5阵列失效,卷无法挂载访问,服务器瘫痪,急需进行服务器数据恢复. 服务器数据恢复第一步

服务器数据恢复案例 / raid5阵列多块硬盘离线处理方法

服务器数据恢复案例一: 某研究院 DELL服务器 磁盘阵列崩溃,内置15块1TB硬盘搭建的RAID5阵列.一开始有一块硬盘离线,在更换新硬盘进行同步的过程中,第二块磁盘指示灯报警,同步失败,阵列无法正常工作.服务器数据恢复检测:最先离线的硬盘访问速度极其缓慢,第二块离线的磁盘有少量坏扇区,其他磁盘无明显物理问题.服务器质逻辑状况:整个阵列只包含一个卷组,该卷组占用阵列全部空间:并且该卷组只有一个起始位置为0扇区的XFS裸分区.制定服务器数据恢复方案:RAID5阵列架构在设计上只支持一块磁盘的错误