一、故障描述
用户是持有一台HP EVA 4100的存储,23块容量为300G的光纤硬盘,上层映射给一台装有windows系统的服务器上,开始发现有三块硬盘亮黄灯,这个时候存储还能正常使用,之后用户就开始联系运维商更换硬盘,在更换硬盘的过程中,又出现一块硬盘亮黄灯离线,这个时候存储就整个崩溃无法使用了,用户对4块硬盘进行检测了下,发现4块硬盘都出现磁头和盘片损坏的情况,只能从剩余的19块硬盘上来进行恢复数据。
二、备份数据
考虑到数据的安全性以及可还原性,在做数据恢复之前需要对所有源数据做备份,以防万一其他原因导致数据无法再次恢复。把磁盘以只读的方式挂载到一台正常的备份服务器上,使用dd命令将所有磁盘都镜像成文件。
三、故障分析
1、分析过程
在检测磁盘之后,有4块硬盘出现物理故障,都是盘片损坏,盘片损坏之后,硬盘上的数据就无法备份,因此这4块硬盘完全损坏,无法在使用,只能使用剩余的19块硬盘来进行恢复,因为之前3块硬盘离线的时候,存储还能正常使用,当4块硬盘都离线之后,存储就崩溃了,因此在缺失一块硬盘的情况下来恢复,可以预知数据会有部分缺失。
2、恢复过程
(1) 先解析基本信息,通过头部信息解析,如下图:
(2)解析RSS组信息,RSS组信息是在做eva恢复的比较重要的,如下图:
(3)解析lun信息,解析lun之后就寻址位图信息进行数据的解析,如下图:
(4)解析MAP位图信息并解析数据,通lun信息提取出来MAP位图信息,通过MAP位图信息,提取数据块组合成逻辑卷并解析,如下图:
四、数据恢复结论
用户数据是由于存储硬盘离线过多导致存储出现问题不能正常访问,离线硬盘都出现硬件盘片划伤,无法恢复离线硬盘的数据。基于对EVA4100存储底层结构了解,并且有处理过类似故障类型的经验。且用户所需数据都是小文件,所以整个恢复过程中还算比较顺利。恢复出来的数据经用户验证无误,至此,数据恢复成功。
原文地址:https://blog.51cto.com/sun510/2405294