如何应对eva存储崩溃的情况?

一、故障描述
用户是持有一台HP EVA 4100的存储,23块容量为300G的光纤硬盘,上层映射给一台装有windows系统的服务器上,开始发现有三块硬盘亮黄灯,这个时候存储还能正常使用,之后用户就开始联系运维商更换硬盘,在更换硬盘的过程中,又出现一块硬盘亮黄灯离线,这个时候存储就整个崩溃无法使用了,用户对4块硬盘进行检测了下,发现4块硬盘都出现磁头和盘片损坏的情况,只能从剩余的19块硬盘上来进行恢复数据。
二、备份数据
考虑到数据的安全性以及可还原性,在做数据恢复之前需要对所有源数据做备份,以防万一其他原因导致数据无法再次恢复。把磁盘以只读的方式挂载到一台正常的备份服务器上,使用dd命令将所有磁盘都镜像成文件。
三、故障分析
1、分析过程

在检测磁盘之后,有4块硬盘出现物理故障,都是盘片损坏,盘片损坏之后,硬盘上的数据就无法备份,因此这4块硬盘完全损坏,无法在使用,只能使用剩余的19块硬盘来进行恢复,因为之前3块硬盘离线的时候,存储还能正常使用,当4块硬盘都离线之后,存储就崩溃了,因此在缺失一块硬盘的情况下来恢复,可以预知数据会有部分缺失。
2、恢复过程
(1) 先解析基本信息,通过头部信息解析,如下图:

(2)解析RSS组信息,RSS组信息是在做eva恢复的比较重要的,如下图:

(3)解析lun信息,解析lun之后就寻址位图信息进行数据的解析,如下图:

(4)解析MAP位图信息并解析数据,通lun信息提取出来MAP位图信息,通过MAP位图信息,提取数据块组合成逻辑卷并解析,如下图:


四、数据恢复结论
用户数据是由于存储硬盘离线过多导致存储出现问题不能正常访问,离线硬盘都出现硬件盘片划伤,无法恢复离线硬盘的数据。基于对EVA4100存储底层结构了解,并且有处理过类似故障类型的经验。且用户所需数据都是小文件,所以整个恢复过程中还算比较顺利。恢复出来的数据经用户验证无误,至此,数据恢复成功。

原文地址:https://blog.51cto.com/sun510/2405294

时间: 2024-10-11 01:20:17

如何应对eva存储崩溃的情况?的相关文章

EMC FC AX-4存储崩溃,raid5硬盘损坏的数据恢复过程

故障描述: 北京某医院EMC FC AX-4存储崩溃,由于RAID5阵列中出现2块硬盘损坏,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,整个存储空间由12块1TB STAT的硬盘组成的,其中10块硬盘组成一个RAID5的阵列,其余两块做成热备盘使用. 由于前两个步骤并没有检测到磁盘有物理故障或者是坏道,由此推断可能是由于某些磁盘读写不稳定导致故障发生.因为EMC控制器检查磁盘的策略很严格,一旦某些磁盘性能不稳定,EMC控制器就认为是坏盘,就将认为是坏盘的磁盘

北京EMC存储崩溃raid离线恢复数据方法

[Raid数据恢复概述]北京某企业一台EMC FC AX-4存储由于存储上的RAID5阵列故障导致存储瘫痪,急需进行raid数据恢复.这台存储中搭建了一组12块硬盘的raid5磁盘阵列,阵列中包括有2块热备盘.由于raid阵列中出现两块硬盘离线,但热备盘中有一块未成功激活,raid真累瘫痪,上层LUN无法正常使用,存储崩溃,数据丢失,客户要求上门对raid阵列进行数据恢复. [Raid5硬盘检测过程]由于硬盘离线原因未知,首先由硬盘工程师对raid阵列中的所有硬盘进行物理检测(包括掉线盘和正常磁

EMC存储崩溃恢复数据过程

[Raid数据恢复概述]北京某企业一台EMC FC AX-4存储由于存储上的RAID5阵列故障导致存储瘫痪,急需进行raid数据恢复.这台存储中搭建了一组12块硬盘的raid5磁盘阵列,阵列中包括有2块热备盘.由于raid阵列中出现两块硬盘离线,但热备盘中有一块未成功激活,raid真累瘫痪,上层LUN无法正常使用,存储崩溃,数据丢失,客户要求上门对raid阵列进行数据恢复.[Raid5硬盘检测过程]由于硬盘离线原因未知,首先由硬盘工程师对raid阵列中的所有硬盘进行物理检测(包括掉线盘和正常磁盘

存储崩溃强制上线是否完全不可行?

服务器数据恢复故障描述: 这次要为大家介绍的数据恢复案例是一台存储因硬盘出现故障导致的数据丢失.这台存储设备为某常见品牌的DS5300型号存储,存储连接扩展柜.存储的最底层是十几块硬盘组成的几组raid5磁盘阵列.管理员有一天发现了存储的多组raid阵列中的一组阵列崩溃了,崩溃原因未知. 数据恢复硬件检测: 经数据恢复工程师对该组因为故障崩溃的磁盘阵列内的所有磁盘进行镜像并检测,发现阵列中有2块硬盘存在大量不规则坏道,只好使用数据恢复工具对存在坏道的硬盘进行恢复和生成镜像. 存储数据恢复过程:

这种方式解决EMC存储崩溃RAID离线问题,简单又高效

故障描述:由于RAID5阵列中出现2块硬盘损坏,而此时只有一块热备盘成功激活,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,整个存储空间由12块1TB SATA的硬盘组成的,其中10块硬盘组成一个RAID5的阵列,其余两块做成热备盘使用.由于前两个步骤并没有检测到磁盘有物理故障或者是坏道,由此推断可能是由于某些磁盘读写不稳定导致故障发生.因为EMC控制器检查磁盘的策略很严格,一旦某些磁盘性能不稳定,EMC控制器就认为是坏盘,就将认为是坏盘的磁盘踢出RAID组.而一旦RAID组中掉线的盘到达

RabbitMQ如何应对消费出现异常的情况

1,生产者 new_task.py import pika if __name__ == '__main__':     connection=pika.BlockingConnection(pika.ConnectionParameters("localhost"))     channel=connection.channel()     channel.queue_declare("Kadima")     message="You are awso

当存储EVA出现故障这种方法可高效解决数据丢失的情况

[EVA存储设备信息]1.HP EVA8400存储:1组扩展柜.2.12个2T FATA磁盘(AG691A 454414-001)和8个300G 15K FC磁盘(AG690A 454411-001)组成.3.主机环境为WINDOWS.[EVA存储故障分析]1.经与用户再三确定得知,数据出现故障后已停止使用.按照以往HP-EVA的故障可能推断,数据恢复的可靠性较高.2.EVA主机及扩展柜正常关机,之后将所有硬盘标好位置序号,拿出.在数据成功恢复之前,不再开启EVA 8400控制器.3.接手磁盘后

EVA 4400存储数据恢复报告

EVA系列存储是一款以虚拟化存储为实现目的的HP中高端存储设备,平时数据会不断的迁移,加上任务通常较为繁重,所以磁盘的负载相对是较重的,也是很容易出现故障的.EVA是依靠大量磁盘的冗余空间,以及故障后rss冗余磁盘动态迁移来实现整个存储的数据保护,但随着越来越多的磁盘掉线,这种保护会接近临界,直至崩溃.下面以EVA存储故障为例,讲解EVA 4400存储数据恢复. 一.故障描述 整个EVA存储结构是由一台EVA4400控制器.EVA扩展柜及若干FC磁盘组成.由于磁盘故障导致存储中LUN不可用,致使

分享一例EVA 4400存储硬盘故障数据恢复方案和数据恢复过程

EVA系列存储是一款以虚拟化存储为实现目的的HP中高端存储设备,平时数据会不断的迁移,加上任务通常较为繁重,所以磁盘的负载相对是较重的,也是很容易出现故障的.EVA是依靠大量磁盘的冗余空间,以及故障后rss冗余磁盘动态迁移来实现整个存储的数据保护,但随着越来越多的磁盘掉线,这种保护会接近临界,直至崩溃.下面以EVA存储故障为例,讲解EVA 4400存储数据恢复. 一.故障描述 整个EVA存储结构是由一台EVA4400控制器.EVA扩展柜及若干FC磁盘组成.由于磁盘故障导致存储中LUN不可用,致使