如何应对eva存储崩溃的情况？

一、故障描述
用户是持有一台HP EVA 4100的存储，23块容量为300G的光纤硬盘，上层映射给一台装有windows系统的服务器上，开始发现有三块硬盘亮黄灯，这个时候存储还能正常使用，之后用户就开始联系运维商更换硬盘，在更换硬盘的过程中，又出现一块硬盘亮黄灯离线，这个时候存储就整个崩溃无法使用了，用户对4块硬盘进行检测了下，发现4块硬盘都出现磁头和盘片损坏的情况，只能从剩余的19块硬盘上来进行恢复数据。
二、备份数据
考虑到数据的安全性以及可还原性，在做数据恢复之前需要对所有源数据做备份，以防万一其他原因导致数据无法再次恢复。把磁盘以只读的方式挂载到一台正常的备份服务器上，使用dd命令将所有磁盘都镜像成文件。
三、故障分析
1、分析过程
在检测磁盘之后，有4块硬盘出现物理故障，都是盘片损坏，盘片损坏之后，硬盘上的数据就无法备份，因此这4块硬盘完全损坏，无法在使用，只能使用剩余的19块硬盘来进行恢复，因为之前3块硬盘离线的时候，存储还能正常使用，当4块硬盘都离线之后，存储就崩溃了，因此在缺失一块硬盘的情况下来恢复，可以预知数据会有部分缺失。
2、恢复过程
（1）先解析基本信息，通过头部信息解析，如下图：

（2）解析RSS组信息，RSS组信息是在做eva恢复的比较重要的，如下图：

（3）解析lun信息，解析lun之后就寻址位图信息进行数据的解析，如下图：

（4）解析MAP位图信息并解析数据，通lun信息提取出来MAP位图信息，通过MAP位图信息，提取数据块组合成逻辑卷并解析，如下图：

四、数据恢复结论
用户数据是由于存储硬盘离线过多导致存储出现问题不能正常访问，离线硬盘都出现硬件盘片划伤，无法恢复离线硬盘的数据。基于对EVA4100存储底层结构了解，并且有处理过类似故障类型的经验。且用户所需数据都是小文件，所以整个恢复过程中还算比较顺利。恢复出来的数据经用户验证无误，至此，数据恢复成功。

原文地址：https://blog.51cto.com/sun510/2405294

时间： 2024-10-11 01:20:17

如何应对eva存储崩溃的情况？

如何应对eva存储崩溃的情况？的相关文章

EMC FC AX-4存储崩溃，raid5硬盘损坏的数据恢复过程

北京EMC存储崩溃raid离线恢复数据方法

EMC存储崩溃恢复数据过程

存储崩溃强制上线是否完全不可行？

这种方式解决EMC存储崩溃RAID离线问题，简单又高效

RabbitMQ如何应对消费出现异常的情况

当存储EVA出现故障这种方法可高效解决数据丢失的情况

EVA 4400存储数据恢复报告

分享一例EVA 4400存储硬盘故障数据恢复方案和数据恢复过程