raid5掉了2块硬盘,热备盘未激活的恢复过程记录

【Raid5阵列数据恢复案例简介】

今天记录一次raid5磁盘阵列数据恢复的成功案例。首先简单介绍一下需要数据恢复的服务器基础配置情况:
·
客户的服务器设备为EMC存储,raid5磁盘阵列,由多块stat硬盘组成一组磁盘阵列,包含两块热备盘。服务器发生故障崩溃时底层硬盘有2块出现故障,热备盘中有一块被激活。
·

【服务器数据恢复常规检测】

数据恢复中心的数据恢复工程师前往客户现场对服务器设备进行故障检测。服务器数据恢复工程师对客户服务器设备进行了简单排查,确认raid5阵列瘫痪;上层lun无法正常使用,2块热备盘中有一块已经启动。
·
数据恢复工程师对掉线的硬盘进行物理排查,两块硬盘中均未检测到坏道、磁头故障等物理损坏。进行接下来的数据恢复操作时可以不需要进行物理修复即可。
·

【raid5数据备份】

在数据恢复操作之前,需要将服务器设备上的所有原始数据进行镜像备份,在本次数据恢复案例中,服务器数据恢复工程师将所有硬盘连接到北亚数据恢复中心的数据恢复专用存储池中,对所有硬盘进行了扇区级镜像操作。
·

【分析该服务器raid组结构】

服务器数据恢复操作通常都是基于恢复raid组进行数据恢复操作的,因此本次数据恢复操作也同样需要对raid阵列基础信息进行分析,从而重组raid结构。
·
经过数据恢复工程师对每一块硬盘的分析发现,客户原服务器内的两块热备盘内全部没有任何数据,也就是说即使被激活的热备盘也同样没有同步到任何数据,两块热备盘从实际上而言并没有发生任何作用。想要恢复数据,只好继续恢复原raid5阵列的其他基本数据,重组raid5.
·

【分析RAID组掉线盘信息】

根据上述数据恢复思路,服务器数据恢复工程师使用自主研发的数据恢复工具分析出该组raid5阵列的基础信息,并虚拟重组出了raid5磁盘阵列。在raid数据恢复常规流程下,我们会将多块硬盘掉线的阵列中最早掉线的硬盘从阵列中剔除。通常我们进行数据分析的方法是比对每块硬盘在同一个条带上的数据是否一致,将明显不同的硬盘剔除后进行条带校验,直至找到数据恢复的最佳状态为止。
·

【分析RAID组中的LUN信息】

成功重组出raid5阵列后,工程师开始对lun信息进行分析,在本次数据恢复案例中,客户的服务器上层只有一个lun,工程师只需要将这唯一的一个lun信息进行分析,然后使用raid数据恢复程序对lun数据的map进行解析和导出。
·

【ZFS文件系统解析并修复】

使用数据恢复工具对上层的文件系统进行解析和恢复。客户上层采用的是zfs文件系统,服务器数据恢复工程师对文件系统解析时发现部分文件系统元文件报错,于是数据恢复工程师对现有的数据恢复工具进行debug调试,使程序适应本次数据恢复的实际情况。
·
经过调试,导致zfs文件系统解析报错的原因是由于客户的服务器突然瘫痪导致文件系统中某些元文件被损坏,导致数据恢复工具无法正常解析。服务器数据恢复工程师针对损坏的元文件采用人工修复等方法,保障zfs文件系统可以被正常解析。
·

【导出raid5阵列内所有数据】

通过对文件系统的完整解析,服务器数据恢复工程师最终将客户raid阵列内的数据完整导出,由客户工程师配合搭建数据验证环境,恢复出来的所有数据进行验证,经过验证,客户原服务器内的所有数据均被成功恢复,本次数据恢复成功。

原文地址:https://blog.51cto.com/sun510/2473487

时间: 2024-10-12 11:15:42

raid5掉了2块硬盘,热备盘未激活的恢复过程记录的相关文章

raid5阵列掉了两块硬盘,都是物理故障,如何恢复数据

1.服务器数据恢复故障描述 今天介绍的这次数据恢复的服务器故障情况为硬盘离线,故障服务器内是由多块硬盘组成的一组raid5磁盘阵列,由于服务器内的硬盘掉线导致服务器崩溃,管理员检查服务器发现这两块硬盘均有物理故障,想要恢复数据必须首先对掉线硬盘进行物理故障的修复. 2.硬盘物理故障修复 服务器数据恢复工程师首先将掉线的两块硬盘进行检测,硬盘加电后磁头无法寻道,分离PCB清洁HDA组件后再次尝试加电依然不能寻道,只能对故障硬盘进行物理修复(洁净间中禁止拍照,此处无图). 3.重组RAID-5磁盘阵

centos7 6块盘 RAID5 一块热备盘

准备6块规格一样大小的盘 安装mdadm工具yum install mdadm准备的盘分别是 /dev/sdb /dev/sdc /dev/sdd /dev/sde /dev/sdf /dev/sdg先用5块盘做RAID5,剩下的一个盘做热备mdadm -Cv /dev/md0 -l5 -n5 /dev/sdb /dev/sdc /dev/sde /dev/sdf /dev/sdg说明:-l5 做RAID5 -n5 使用5块盘查看相关磁盘信息cat /proc/mdstat 用剩下的一个盘做热备

raid5磁盘阵列有3块硬盘掉线的解决方案-raid数据恢复案例

某公司使用了同友存储,采用raid5磁盘阵列,由于未知的原因导致存储忽然崩溃无法启动,raid5阵列中的虚拟机全部丢失,其中3台虚拟机为重要数据,需要主要针对该3台虚拟机进行数据恢复. 一.分析存储底层次结构,制定数据恢复方案. 通过与客户的沟通及对raid阵列的分析得出故障存储的底层结构为若干物理磁盘组成一个存储池,划分了多个lun,需要进行数据恢复的为lun1,其中包含重点恢复的3台虚拟机.如下图所示: 二.尝试重组raid恢复raid阵列数据. 在对阵列进行分析重组时发现用户原存储中的ra

联想服务器X3650 M2 配置 RAID5 + 热备盘

实验环境: 1.  服务器型号联想 System X3650 M2 2.  六块300G  SAS硬盘 实验目的: 配置RAID 5 ,搭建重要文件备份服务器. 标注:本教程六块硬盘,其中五块硬盘做RAID 5,另外一块硬盘做热备盘,如果有一块硬或两块硬盘同时损坏及时更换硬盘数据依然正常运行 (热备盘作用是RAID5只允许其中有一块损坏,如果同时损坏两块硬盘以上数据就会丢失,但热备盘可以替换上去,RAID5同时损坏两块硬盘数据 依然正常运行),如果有三块或三块以上硬盘损坏就会发生灾难性数据丢失.

dell服务器在bios中指定raid5的热备盘

一.创建raid5 二.指定热备盘 选择第15块磁盘作为上面创建的raid5的热备盘 选中 选中我们刚创建的raid5,点击OK 原文地址:https://www.cnblogs.com/cnhyk/p/11766409.html

IBM V7000 raid5数据恢复(多块硬盘离线)

设备信息: 故障表现:首先有一块硬盘出现故障离线,热备盘启用替换,在此时与离线盘同一组Mdisk中又有其他另一块磁盘出现故障离线.从而导致热备盘同步失败,这组Mdisk失效,进而影响到整个通用卷,通用卷无法使用. 数据恢复概率分析:由于整个阵列失效的原因是磁盘故障导致的,所以如果磁盘损坏程度较轻的情况下则数据恢复的可能性极大,本案例中客户需要的数据主要是dcm图像文件,所以预期可以95%恢复数据. 技术流程: 1.在数据恢复前期需要将数据进行备份,以免在数据恢复的过程中对数据的原始状态进行更改.

RAID及热备盘详解

RAID,为Redundant Arrays of Independent Disks的简称,中文为廉价冗余磁盘阵列. 一.出现的原因(RAID的优点): 它的用途主要是面向服务器,但现在的个人电脑由于需求变大,需要几块硬盘,而计算机默认的是对第一块硬盘有缓存,而其它的则没有,这样就导致计算机访问其它的硬盘的速度特别的慢,这时磁盘阵列技术出现了,组合小的廉价磁盘来代替大的昂贵磁盘,用于协调几块硬盘的访问. 在很多RAID模式中都有较为完备的相互校验/恢复的措施,甚至是直接相互的镜像备份,从而大大

oracle数据库热备中的备份和恢复及例子

手工热备(开库状态) 备份控制文件: alter database backup controlfile to '/u01/oradata/prod/con.bak1'; 备份数据文件(这里用到pl/sql进行批处理,将查询结果粘贴运行即可) beginfor i in (select tablespace_name from dba_tablespaces) loop dbms_output.put_line('alter tablespace '||i.tablespace_name||'

数据恢复过程之:服务器raid5两块硬盘离线数据恢复

服务器故障情况简介:客户的一台ibm x3850服务器上组了一个raid5磁盘阵列,有两块硬盘离线,服务器崩溃.北亚数据恢复中心工程师对服务器进行初检,客户的磁盘阵列由5块硬盘组成,linux redhat 5.3操作系统,存储一个oracle数据库.阵列中有两块硬盘处于离线状态,热备盘未激活.硬盘无物理故障,无明显同步表现.数据恢复方案:1.关闭服务器同时确保在恢复过程中不再开启服务器,将故障盘进行标记后取出槽位挂载至数据恢复公司的备份服务器环境进行镜像备份.完成后恢复原故障服务器.2.分析备