EMC存储raid阵列分区丢失的恢复过程

一、磁盘阵列分区丢失的过程介绍

事情的起因是由于机房的管理员按照规定对机房进行定期维护,结果由于操作失误导致一台某品牌的服务器设备(raid5磁盘阵列)中的分区丢失,丢失的分区中存储了该公司所有生产业务数据,业务因此瘫痪。经数据恢复工程师检测后发现由于该服务器文件系统头部的超级块及部分节点、目录项丢失,根据超级块备份及文件系统中的目录树结构,对超级块进行修复还原,对丢失的节点、目录项进行修补、重构之后,文件系统可以完整恢复。
·

二、raid5磁盘阵列数据恢复过程

1.数据恢复工程师接到客户服务器后首先将所有硬盘通过镜像的方式被分到数据恢复专用存储上,备份成功后将客户的原服务器交还客户。
2.使用服务器数据恢复工具对客户的备份数据进行解析,(注意,该数据恢复工具目前为内部使用,也可借助市面上其他同类数据恢复辅助工具搜索file id进行分析阵列)经过解析得到磁盘阵列的盘序规律、条带大小等基础信息,由于此操作具有一定风险,切不可在原设备上进行操作。
3.通过对备份数据进行解析可以直接得到原raid阵列的基本信息,工程师利用这些信息重组raid5磁盘阵列,然后定位xfs文件系统的分区起始位置;(注:XFS INODE number:变长的位数表示,三部分组成:起始块组号+起始块号+块内INODE号。起始块号与块内INODE号的位长由SUPERBLOCK中参数指定。)
4.服务器数据恢复工程师对该文件系统完整性和文件系统正确性进行校验,结果显示xfs文件系统头部超级快丢失、部分节点丢失、目录项丢失。
5.根据超级块备份及文件系统中的目录树结构,对超级块进行修复还原(过程略)。对xfs文件系统中丢失的节点及目录项进行修复;对丢失的节点、目录项进行修补、重构。
6.上述修复工作完成后编写一个小程序对文件系统进行解析和数据提取即可。



·

三、raid5磁盘阵列数据恢复成功

由于数据丢失之后客户未对存储做任何写入的破坏性操作,所以数据及文件系统信息绝大部分保留完整,服务器数据100%恢复。

原文地址:https://blog.51cto.com/sun510/2375803

时间: 2024-11-05 13:40:07

EMC存储raid阵列分区丢失的恢复过程的相关文章

EMC存储Raid故障数据分析报告

一.故障描述用户的EMC FC AX-4存储出现崩溃现象,整个存储空间由12块1TB STAT的硬盘组成的,其中10块硬盘组成一个RAID5的阵列,其余两块做成热备盘使用.由于RAID5阵列中出现2块硬盘损坏,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用.二.检测磁盘由于存储是因为某些磁盘掉线,从而导致整个存储不可用.因此接收到磁盘以后先对所有磁盘做物理检测,检测完后发现没有物理故障.接着使用坏道检测工具检测磁盘坏道,发现也没有坏道.三.备份数据考虑到数据的安

记录一次raid信息丢失的成功恢复过程,恢复结果极度舒适

[存储raid阵列故障的起因] 事情的起因是这样的,这次经历的数据恢复设备为DL380系列存储,存储中存储的是客户公司内部文件和机密信息.存储上共有6块硬盘组成raid5阵列,在正常使用过程中存储突然崩溃,强制重启后无法找到存储设备,再重启还是这样.客户于是联系我们进行存储层面的数据恢复.· [数据恢复故障分析] 经过和硬件部门同事的一同检测和分析,大致可以推断客户这台存储的故障应该是raid模块损坏,一般出现这种raid信息丢失或者raid模块硬件损坏的原因多是由于多次的断电造成的.说回到本次

联想Lenovo服务器RAID阵列数据恢复

服务器作为数据集中存储和管理的地方,一旦其发生故障,会给用户和企业带来非常大数据损失.联想作为目前比较热门的服务器品牌,被很多企业所使用,也伴随着越来越多联想服务器数据恢复问题的出现.其中一种就是服务器raid卡损坏的数据恢复问题.那么,有没有方法能够解决联想Lenovo服务器RAID阵列数据恢复呢? 引起联想服务器数据丢失的常见故障有6种:lenovo联想服务器RAID阵列信息丢失,造成整台服务器无法启动:lenovo联想服务器硬盘一块硬盘掉线,报红灯,系统服务无法启动:将lenovo联想服务

第七章 RAID阵列和LVM磁盘阵列技术 第7天 7月26日

RAID 磁盘冗余阵列 目的:提高可用性,读取速度,安全性 通过多盘的协作来达到这一指标 但是不经济,提高了公司的支出.除非认为,数据大于费用 RAID的种类 RAID0 数据分布在不同的两块盘上,读取速度快,但是一块损坏另一块也损坏. RAID1 数据分布在相同的两块盘上,无损备份. RAID5 三块盘组成最小的RAID,但是奇偶校验数据放在除自身盘符外的其他盘上,以备损坏后备份. RAID10 是RAID1和RAID0的组合体.四块硬盘先两两组合成RAID1,两块RAID1再组合成RAID0

北京EMC存储崩溃raid离线恢复数据方法

[Raid数据恢复概述]北京某企业一台EMC FC AX-4存储由于存储上的RAID5阵列故障导致存储瘫痪,急需进行raid数据恢复.这台存储中搭建了一组12块硬盘的raid5磁盘阵列,阵列中包括有2块热备盘.由于raid阵列中出现两块硬盘离线,但热备盘中有一块未成功激活,raid真累瘫痪,上层LUN无法正常使用,存储崩溃,数据丢失,客户要求上门对raid阵列进行数据恢复. [Raid5硬盘检测过程]由于硬盘离线原因未知,首先由硬盘工程师对raid阵列中的所有硬盘进行物理检测(包括掉线盘和正常磁

raid出现故障导致文件丢失如何恢复

RAID磁盘阵列设备,在使用过程中,经常会遇到一些常见故障,这也使得RAID在给我们带来海量存储空间的应用之外,也带来了很多难以估计的数据风险.本文将重点介绍RAID常见故障及raid文件恢复的相关处理方式. RAID的目的就是利用磁盘空间的冗余实现数据容错,不过这是在所有的磁盘或卷没有任何问题的前提下实现的.当RAID卷中的单个磁盘出现故障后,尽管数据可能暂时不会受到威胁,但是磁盘 冗余已经没有了,此时任何不当的操作都可能毁掉已经存放的数据.因此,在充分享受RAID所带来的安全好处时,还应该想

这种方式解决EMC存储崩溃RAID离线问题,简单又高效

故障描述:由于RAID5阵列中出现2块硬盘损坏,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,整个存储空间由12块1TB SATA的硬盘组成的,其中10块硬盘组成一个RAID5的阵列,其余两块做成热备盘使用.由于前两个步骤并没有检测到磁盘有物理故障或者是坏道,由此推断可能是由于某些磁盘读写不稳定导致故障发生.因为EMC控制器检查磁盘的策略很严格,一旦某些磁盘性能不稳定,EMC控制器就认为是坏盘,就将认为是坏盘的磁盘踢出RAID组.而一旦RAID组中掉线的盘到达

EMC存储崩溃恢复数据过程

[Raid数据恢复概述]北京某企业一台EMC FC AX-4存储由于存储上的RAID5阵列故障导致存储瘫痪,急需进行raid数据恢复.这台存储中搭建了一组12块硬盘的raid5磁盘阵列,阵列中包括有2块热备盘.由于raid阵列中出现两块硬盘离线,但热备盘中有一块未成功激活,raid真累瘫痪,上层LUN无法正常使用,存储崩溃,数据丢失,客户要求上门对raid阵列进行数据恢复.[Raid5硬盘检测过程]由于硬盘离线原因未知,首先由硬盘工程师对raid阵列中的所有硬盘进行物理检测(包括掉线盘和正常磁盘

EVA4400存储RAID信息丢失数据恢复过程

[服务器数据恢复故障分析]在数据恢复行业中经常会遇到因为意外断电导致raid模块硬件损坏或者riad管理信息丢失等raid模块损坏导致数据丢失的情况.正常情况下服务器的raid阵列一旦创建完成后就不再对管理模块中的信息进行更改,不过raid管理模块的信息其实是可修改信息,一次或多次的意外断电是可能造成这部分信息被篡改或丢失的,断电次数过多时甚至可能导致raid卡上的元器损坏.间接导致主机失去对多块物理硬盘进行RAID管理的中间层模块.该客户的服务器就属于这种情况. [服务器数据恢复故障描述]客户