硬盘物理故障开盘+RAID-5阵列瘫痪恢复数据过程

服务器数据恢复故障描述

服 务 器 型 号:HP P2000
服务器操作系统:VMWARE ESX
服务器文件系统:VMFS
磁盘阵 列 级 别:RAID-5
需要进行数据恢复的服务器挂载了8块硬盘组成RAID-5磁盘阵列,其中4号盘是热备盘,服务器在正常运行中两块硬盘亮×××故障灯,经用户方维护人员检测,故障硬盘应为物理故障,表现为:序列号无法读取,在SAS扩展卡上硬盘无法识别。需要对raid磁盘阵列进行数据恢复
**

硬盘物理故障修复

由于服务器故障情况严重,需要首先确定该组raid阵列的磁盘掉线原因,工程师在接到用户服务器后优先处理raid阵列中的两块掉线盘,将坏盘连接到外部的SAS扩展卡上加电检测,磁头不寻道,工程师将PCB分离、检查硬盘HDA组件发现有部分氧化,进行清洁操作后再次加电检查依然无法寻道。于是工程师进行十分复杂的修盘工作(无尘室禁止拍照修盘过程无图)
由于热备盘是正常硬盘,可以作为备件盘使用。于是硬件工程师将备件盘(也就是raid阵列中的4号盘)开盘拆取PCB安装到故障盘上替换故障盘的PCB进行修复,再将故障盘PCB上的ROM芯片拆取替换到新PCB上。硬盘硬件修复完成后再次对故障硬盘进行检测可以正常起转,磁头寻道声音正常,但是敲盘声音明显。由于4号盘的磁头与故障盘并不匹配,在另找配件后进行更换磁头操作,硬盘可以正常识别,故障盘数据镜像成功。
**

重组RAID-5磁盘阵列

使用数据恢复工具打开7块磁盘发现所有硬盘的的0扇区都有“55 AA”标志,0x01C2H处表示该分区的类型,这里显示“05”,代表这是一个扩展分区。因此从0扇区看这是一个不正常的MBR分区结构。
按照这一方法继续查找,分别在7号盘和8号盘找到了“55 AA”的标志。8号盘查询结果如下。这是一个正常的MBR分区,其0x01C6处数值代表指向的下一个扇区为GPT的头部。
图1

7号盘查询结果如下。其0x01C6处数值代表指向下一个扇区。但是下一个扇区很明显不是GPT的头部。
图2

由此可以确定8号盘是第一块盘,7号盘可能是最后一块盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。
知识补课:条带也就是raid阵列块,它是RAID处理数据的基本单元。不同的RAID阵列的条带大小也各不相同。RAID-5的1个条带组中有1个校验区,根据这个规律可以对该raid-5阵列进行分析,也可以通过比较法确定条带大小。如某一条带组中的校验区跟这一条带组中的非校验区可能相差的很明显,通过WinHex查看并做对比,就可以找到条带大小。工程师对该服务器raid阵列分析得出条带大小为1024个扇区。
按照1024扇区分割,使一个记录为一个条带的大小,如图5所示。并且7块盘跳到同一记录283123。
图3

当7块盘都定位到同一位置时,通过对比可以判断校验区的走向,继而判断整个RAID-5的走向。之前已经判断出8号盘是第一块盘了,把8号盘放在第一个位置,确定RAID-5为左走向,盘序为8,2,3,4,1,7,5。
图4

工程师初步确定了LUN的起始扇区是172032扇区。使用数据恢复工具跳到172032扇区对硬盘的使用情况进行观察,正常情况下这个扇区所属条带中的5号盘应该是校验区,但实际情况中却显示校验区为8号盘,根据该raid左走向的规律,5号盘的校验区应该在172032-1024=171008扇区,即上一个条带。跳转到171008扇区,发现校验区为5号盘。因此可以确定LUN的起始扇区为171008扇区。
使用数据恢复工具按照确定的盘序重组raid添加进去,如图所示。选择RAID-5,Stripe size 512KB,左异步。
图5

点击Build进行重组。组好后,由于数据从1024*8=8192个扇区开始,若专业恢复工具没有跳转到此扇区的功能,那么刚组好的RAID必须和一个文件再进行一次Build重组操作。RAID的起始扇区(Start sectors)选择8192,这个文件可以任意选择起始扇区和大小大小(Count sectors),下图为重组后的raid5磁盘阵列。
图6
**

服务器数据恢复结果

RAID-5磁盘阵列重建完成经由客户验证,验证通过,服务器数据恢复成功。

原文地址:http://blog.51cto.com/sun510/2121608

时间: 2024-10-06 09:14:46

硬盘物理故障开盘+RAID-5阵列瘫痪恢复数据过程的相关文章

HP P2000两块硬盘物理故障修复过程+raid条带分析方法

1.服务器数据恢复故障描述 服务器型号:HP P2000服务器操作系统:VMWARE ESX服务器文件系统:VMFS磁盘阵列级别:RAID-5需要进行数据恢复的服务器挂载了8块硬盘组成RAID-5磁盘阵列,其中4号盘是热备盘,服务器在正常运行中两块硬盘亮×××故障灯,经用户方维护人员检测,故障硬盘应为物理故障,表现为:序列号无法读取,在SAS扩展卡上硬盘无法识别.需要对raid磁盘阵列进行数据恢复 2.硬盘物理故障修复 由于服务器故障情况严重,需要首先确定该组raid阵列的磁盘掉线原因,工程师在

HP存储raid5两块硬盘离线lvm下vxfs文件系统恢复数据过程

故障描述 HP FC MSA2000存储,由于RAID5阵列中出现2块硬盘损坏并离线,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,用户联系联系北亚数据,整个存储空间由8块450GB SAS的硬盘组成,其中7块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用. 由于存储是因为RAID阵列中某些磁盘掉线,从而导致整个存储不可用.因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障.接着使用坏道检测工具检测磁盘坏道,发现也没有坏道. 解决方法:

磁盘阵列3块有硬盘掉线使用第二种校验方式恢复数据

Raid6磁盘阵列可以看做是raid5阵列的升级版,在raid5的奇偶校验基础上又增加了一种校验,就空间使用率而言raid5磁盘阵列是N-1的空间使用率,raid6阵列是N-2的空间使用率.小编经常记录恢复raid5磁盘阵列的案例,今天介绍一个raid6阵列的数据恢复案例.这次数据恢复的硬件设备是某公司的一台web服务器,raid6磁盘阵列,一共有6块硬盘,现在已经有3块硬盘处于离线状态,服务器崩溃,服务器上的MySQL数据库数据丢失,业务停滞,客户想在北京联系数据恢复公司进行数据恢复,于是联系

硬盘常见故障有哪些,如何恢复数据?

硬盘数据恢复故障类型 1 硬盘数据恢复软件类故障的特点为: 无法进入操作系统.文件无法读取.文件无法被关联的应用程序打开.文件丢失.分区 丢失.乱码显示等.2 硬盘数据恢复常见硬件故障原因主要有: 硬盘的读写磁头由于受到剧烈震动后极易损坏,导致不认硬盘,因此硬盘的 磁头组件是硬盘硬件损坏的常见故障; 硬盘的供电.接口故障; 硬盘主板电路板烧毁故障; 硬盘电机驱动芯片损坏导致主轴电机不转; 硬盘的盘片包括逻辑性坏道和物理性坏道的故障; 硬盘的固件丢失或损坏等故障.另外硬盘的缓存若出现故障会导致硬盘

EMC存储崩溃恢复数据过程

[Raid数据恢复概述]北京某企业一台EMC FC AX-4存储由于存储上的RAID5阵列故障导致存储瘫痪,急需进行raid数据恢复.这台存储中搭建了一组12块硬盘的raid5磁盘阵列,阵列中包括有2块热备盘.由于raid阵列中出现两块硬盘离线,但热备盘中有一块未成功激活,raid真累瘫痪,上层LUN无法正常使用,存储崩溃,数据丢失,客户要求上门对raid阵列进行数据恢复.[Raid5硬盘检测过程]由于硬盘离线原因未知,首先由硬盘工程师对raid阵列中的所有硬盘进行物理检测(包括掉线盘和正常磁盘

MySQL 5.6.26 通过frm & ibd 恢复数据过程

在A服务器上创建数据库yoonroot(yoon)> show create table yoon\G*************************** 1. row *************************** Table: yoonCreate Table: CREATE TABLE `yoon` ( `id` int(11) DEFAULT NULL, `name` varchar(20) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET

raid5阵列掉了两块硬盘,都是物理故障,如何恢复数据

1.服务器数据恢复故障描述 今天介绍的这次数据恢复的服务器故障情况为硬盘离线,故障服务器内是由多块硬盘组成的一组raid5磁盘阵列,由于服务器内的硬盘掉线导致服务器崩溃,管理员检查服务器发现这两块硬盘均有物理故障,想要恢复数据必须首先对掉线硬盘进行物理故障的修复. 2.硬盘物理故障修复 服务器数据恢复工程师首先将掉线的两块硬盘进行检测,硬盘加电后磁头无法寻道,分离PCB清洁HDA组件后再次尝试加电依然不能寻道,只能对故障硬盘进行物理修复(洁净间中禁止拍照,此处无图). 3.重组RAID-5磁盘阵

意外断电造成RAID 5阵列卡数据故障的恢复方法

由于技术的不断进步,不同型号的服务器出现RAID 5故障后,处理方法也不同.现在大型应用程序的网络拓朴结构,一般都采用C/S结构或B/S结构,至少需要一台装有大型数据库的服务器安放于中心机房.基于对服务器安全性与可靠性的考虑,通常会对服务器的磁盘采用磁盘阵列RAID(Redundant Array of Inexpensive Disk)进行磁盘冗余备份.其中RAID 5阵列级别为无独立校验磁盘的奇偶校验磁盘阵列,采用数据分块和独立存取技术,能在同一磁盘上并行处理多个访问请求,同时允许阵列中的任

不同容量硬盘创建raid 10阵列案例解析

情景:在DELL 5/i或6/i阵列卡中,有2块146G盘(插槽号0 ~ 1),4块300G盘(插槽号2~5),共6块.现在想要创建raid 10阵列,那么最后阵列总容量是多大呢? 解析:按照常规理解,这种模式下,应该是以最小硬盘的容量为准,既146*3 = 438G的容量.但实际上,却并非如此,而是:146+300*2 = 746的容量,这是为什么呢? 其实产生这个结果是个凑巧,因为此时的阵列是这样做的: 0 ó(镜像) 1 => 条带1 2 ó(镜像) 3 => 条带2 4 ó(镜像) 5