EMC CX4-480服务器数据恢复案例

【用户信息】上海某公司
【故障描述】需要进行数据恢复的设备是一台EMC CX4的存储服务器,因为硬盘出现故障导致整个存储阵列瘫痪。整个LUN是由7块1TB的硬盘组成的RAID 5。但服务器共有10块硬盘,其中有3块是以前存储中掉线的硬盘。(服务器存储在使用过程中有硬盘掉线了,但客户只是添加了一块的新的硬盘做rebuild,并没有将掉线的硬盘拔掉,所以就多出了3块)。
因客户说是存储服务器中有些硬盘有故障才导致存储服务器不可用的,所以初步判断是RAID中有硬盘掉线了。将所有硬盘交给硬件工程师检测硬盘是否有硬件故障。在检测完成后发现并没有物理故障,那么可能就是硬盘上有逻辑坏道或其他原因导致RAID不可用了 。接着对所有硬盘做全盘镜像,以保证客户现有数据的安全。
<br/>【恢复过程】做完镜像后开始分析RAID的结构,打开镜像盘的后发现硬盘每512字节多加了一个8字节的校验,也就是变成了每扇区520字节了。这样虽然可以分析RAID的结构,但是重组RAID就会十分吃力!为了提高工作效率,我们需要写个小程序将8字节的校验去掉来方便后期的工作。<br/>等所有磁盘都转换完成后,就开始分析RAID的结构了。由于多了3块以前的旧盘,需要通过比较每块磁盘,即其中会有两块磁盘前面的一部分相同,而这两块当中会有一个是旧的,旧的数据量没有新盘多,就可以排除旧的磁盘。这样的磁盘会有3对,也就可以排除所有旧的磁盘了。<br/>接下来看RAID结构,由于客户用的NTFS文件系统,用MFT很容易就可以找到RAID的结构了。知道RAID结构后发现这不是一个普通的RAID 5,而是一个双循环。用winhex还没法重组RAID。最后发现,UFS可以重组RAID。那么就先用它重组RAID!重组RAID后发现数据不是最新的。我想可能是RAID 5先掉线一块硬盘,而管理员没有及时发现,没有及时添加新的硬盘做rebuild。导致运行一段时间后又有一块硬盘掉线了,才造成整个RAID不可用。所以还需要找出一块旧的磁盘,才能生成最新的数据。继续进行找盘的工作!但是怎么找呢?我们尝试依次踢掉一块硬盘,然后重组RAID。看最新的数据是否可用。直到找到最新的数据可用为止,接着就可以导出数据,验证数据了。<br/>
【恢复结果】整个恢复过程,包括做镜像,扇区转换和最后的拷贝数据,一共耗时5天。数据恢复率达百分之九十九以上。虽然整个过程比较漫长,但是最终的结果用户很高兴,因为这给他们带来了不必要的损失。
作者:邓奇 (服务器数据恢复工程师)

原文地址:http://blog.51cto.com/sun510/2074030

时间: 2024-10-12 07:33:23

EMC CX4-480服务器数据恢复案例的相关文章

服务器数据恢复案例 / raid5阵列多块硬盘离线处理方法

服务器数据恢复案例一: 某研究院 DELL服务器 磁盘阵列崩溃,内置15块1TB硬盘搭建的RAID5阵列.一开始有一块硬盘离线,在更换新硬盘进行同步的过程中,第二块磁盘指示灯报警,同步失败,阵列无法正常工作.服务器数据恢复检测:最先离线的硬盘访问速度极其缓慢,第二块离线的磁盘有少量坏扇区,其他磁盘无明显物理问题.服务器质逻辑状况:整个阵列只包含一个卷组,该卷组占用阵列全部空间:并且该卷组只有一个起始位置为0扇区的XFS裸分区.制定服务器数据恢复方案:RAID5阵列架构在设计上只支持一块磁盘的错误

服务器数据恢复案例探究

一.故障描述 整个服务器的存储空间由6块SAS硬盘组成,其中5块硬盘组成一个RAID5的阵列,剩余1块做成热备盘使用.由于RAID5阵列中出现1块硬盘故障,所以服务器存储中的热备盘成功激活,在进行同步的过程中又一块硬盘出现故障,因此导致RAID5阵列瘫痪,上层LUN无法正常使用,服务器崩溃.服务器数据恢复工程师与硬件数据恢复工程师同时对客户存储进行检测发现该服务器存储中的硬盘存在有物理故障.· 二.服务器存储数据恢复故障检测 IBM服务器存储的LUN都是基于RAID组的,因此要进行服务器数据恢复

服务器数据恢复案例之xfs数据丢失数据恢复方法

今天为大家分享的是一例服务器linux系统下xfs文件系统数据丢失的案例,武汉某公司的服务器出现故障,管理员使用xfs_repair工具修复文件系统,但文件系统修复失败导致服务器中数据全部丢失,经过多方咨询与比较后,客户联系到北京数据恢复公司,由于客户数据涉及保密且恢复难度较大,数据恢复中心从北京总部派出服务器数据恢复工程师前往客户现场进行数据恢复.一.服务器 故障描述客户服务器为linux服务器,连接一台华为存储.客户使用的文件系统为XFS文件系统,在一次机器故障中,客户使用xfs_repai

服务器数据恢复案例_xfs数据丢失的数据恢复过程

简介:太原一家公司的服务器出现故障,服务器是linux服务器,连接了一台某型号的存储,文件系统为xfs文件系统.管理员使用xfs_repair工具试图对文件系统进行修复但修复失败,linux服务器中所有数据因此丢失.管理员在北京的数据恢复公司中选择了我们进行相关咨询,由于客户数据涉密且恢复难度较大,我们从北京总部派出服务器数据恢复工程师前往客户现场进行服务器数据恢复. 服务器数据恢复解决方案:为了不损毁客户丢失数据盘里的数据,数据恢复的第一步必须对客户的原始存储空间开进行镜像备份工作,数据备份完

服务器数据恢复案例介绍;服务器崩溃修复

服务器数据恢复过程: 某法院的一台服务器由于硬盘出现故障导致服务器崩溃,在当地一家数据恢复机构进行了数据恢复操作,但是数据恢复没有成功,于是负责人在北京寻找数据恢复公司进行数据恢复.这台服务器的基本配置情况如下图中所示.该服务器负责人携带服务器内的所有硬盘来到北京数据恢复中心,硬件工程师首先对所有硬盘进行物理检测,经检测未发现硬盘物理故障,也就是说该服务器崩溃的原因并不是硬盘故障.服务器数据恢复工程师对硬盘进行了全盘镜像并分析镜像文件尝试找出服务器故障原因.经过分析发现服务器内至少有2块硬盘离线

IBM V7000数据恢复过程;服务器数据恢复成功率分析

IBM V7000存储是一款定位中端的存储设备,很多企业选择该服务器作为存储,最近北亚数据恢复中心接到一例V7000服务器数据恢复案例,下面将对本次数据恢复的过程和数据恢复方法进行归纳总结,希望对各位管理员在服务器的运维工作有所帮助.服务器状态介绍:需要进行数据恢复的服务器故障表现为vdisk丢失,操作系统中的数据库无法正常使用.管理员重建MDisk,原来的raid10重建为raid6,然后又再次重建为riad10,这一系列的操作导致服务器对应的存储池中的VDisk丢失,从而影响上层Solari

服务器数据恢复成功案例+服务器数据恢复通用原理

服务器数据恢复案例一:某研究院 DELL服务器 磁盘阵列崩溃,内置15块1TB硬盘搭建的RAID5阵列.一开始有一块硬盘离线,在更换新硬盘进行同步的过程中,第二块磁盘指示灯报警,同步失败,阵列无法正常工作.服务器数据恢复检测:最先离线的硬盘访问速度极其缓慢,第二块离线的磁盘有少量坏扇区,其他磁盘无明显物理问题.服务器质逻辑状况:整个阵列只包含一个卷组,该卷组占用阵列全部空间:并且该卷组只有一个起始位置为0扇区的XFS裸分区.制定服务器数据恢复方案:RAID5阵列架构在设计上只支持一块磁盘的错误冗

EMC CX4-480数据恢复案例

EMC做为存储界的领军品牌,其存储产品可谓是人尽皆知啊!并且EMC自己的存储系统以及它自己的硬件在存储领域中都是领先的.但这还是不能百分之百保证用户数据的绝对安全,因为用户的误操作以及硬件的老化都会导致用户重要的数据丢失.而发生这些故障之后只能找专业的数据恢复公司做数据挽救工作.作者最近就处理过一起EMC CX4-480因磁盘故障导致存储不可用的案例,见下文. 一位上海的客户描述说他们有一台EMC CX4的存储服务器,因为硬盘出现故障,导致整个存储阵列瘫痪.整个LUN是由7块1TB的硬盘组成的R

IBM服务器 三块SAS 1TB 硬盘组成RAID5,同时离线数据恢复案例

IBM服务器 三块SAS 1TB 硬盘组成RAID5,同时离线数据恢复案例 一:故障服务器:硬盘同时离线,数据无法访问. 二:修复方法: 1:将硬盘接上专业设备进行全盘镜像. 2:将镜像出来的三个文件进行手工分析 3:分析步骤如下. 打开 winhex查找十六进制(46494C45) MFT 文件记录编号,三个硬盘分析结果如下图: 客户单盘信息 4:用winhex创建RAID5,选择硬盘.盘序和块大小,同异步就是我们上面分析出来的结果. 5:创建RAID5后,三个分区显示都正常. 6:打开最后一