虚拟机数据丢失的数据恢复过程和数据恢复方法

中石化某省分公司的信息管理平台,几台VMware虚拟机——ESX SERVER共享一台IBM DS4100存储,大约有40~50组虚拟机,占用1.8TB空间,正常工作中,vc里报告虚拟磁盘丢失,ssh到ESX中执行fdisk -l查看磁盘,发现storage已经没有分区表了。重启所有设备后,ESX SERVER均无法连接到DS4100所在的STORAGE。

我们接到案例后仔细询问当时的管理员但是可用信息不多,但是他们无意间提到曾经在这个存储网络里连接过一台windows 2003服务器,具体情况不详。于是很自然地想到了,可能是那台windows 2003因对storage的独享操作导致了整个vmfs卷损坏。

以整个存储做分析发现分区表清0,有55aa有效结束标志,有硬盘ID标志。简单从前向后查看,发现一个NTFS卷,但似乎并未写数据进去,像一个刚刚格式化的卷,对这个NTFS卷的BITMAP做分析,得知大小约为1.8T(全部空间),前部占用部分空间,3G左右位置占用部分空间,0.9T附近占用部分空间,但总占用空间不超过100M。针对VMFS卷进行分析,发现在原1.8TB的磁盘里有2组VMFS分区,第2组是对第一组的extend,第一组约1.5T,第二组约300GB,因NTFS分区并未写数据到第二个VMFS分区里(最后一个扇区的DBR备份没有覆盖有用数据),所以重点在于第一个VMFS分区。分析第一组VMFS,卷头结构丢失,一级索引、二级索引均存在,NTFS覆盖的数据区正好是某组虚拟机的临时内存镜像,损坏也无妨。

通过以上分析,我们就可以进行数据的恢复了,
第一步:对整个STORAGE进行镜像备份。
第二步:分析后,连接两个VMFS分区,直接按照VMFS分析组织方式提取所有VMDK及配置文件。
第三步:通过nfs直接迁移回ESX SERVER。
另:本例中因已对故障存储做了安全备份,修复中同时直接重建第一组VMFS卷头,索引列表、分区表等信息,直接附加在ESX SERVER环境,算是第二个方案。

经过两天的努力,数据成功恢复,在此感谢工程师们为此付出的努力。
[其他]
1、本例中依然是因为光纤环境互斥不当导致的问题,实际上,应该是这个卷在WINDOWS系统做了重新分区,并格式化成了NTFS,之后又对分区做了删除操作。因ESX VMFS的互斥不依赖于硬件,只依赖于操作系统驱动层,所以在其他服务器接入存储网络时一定要小心,尽量考虑好存储分配权限。
2、ESX因便捷的信息集中管理,真正使用中往往数据特别重要,一定要做好备份工作,并考虑损坏时迁移的方便性。

时间: 2024-10-01 17:51:47

虚拟机数据丢失的数据恢复过程和数据恢复方法的相关文章

Xen Server虚拟机数据丢失的恢复过程

虚拟机数据丢失情况描述 因服务器突然断电原因导致Xen Server服务器中一台VPS(即Xen Server虚拟机)不可用,虚拟磁盘文件丢失.硬件环境是Dell 720服务器配戴一张H710P的RAID卡,由4块希捷2T STAT硬盘组成的RAID 10,上层环境是Xen Server 6.2版本操作系统,虚拟机是Windows Server 2003系统,10G系统盘 + 5G数据盘两个虚拟机磁盘,上层是Web服务器(ASP + SQL 2005的网站架构). 分析故障原因 为确保客户原始数

FreeNAS+ESXi5数据恢复过程+虚拟化数据恢复方法

[背景简介] 故障发生在苏州的一家公司,此公司使用一种廉价的存储模式,用iSCSI方式来达到FC SAN的功能.物理存储构架在一台 DELL 服务器上,使用 FreeNAS 来做 iSCSI,然后使用两台 DELL 服务器做 ESXi5.0 的的虚拟化系统.FreeNAS 层为UFS2文件系统,整个存储建一个稀疏模式的文件,挂给ESXi5.0 系统.ESXi系统内跑有5台虚拟机,其中有三台最为重要.一台windows2003系统虚拟机是此公司在当地的门户网站.使用 ASP.net和 PHP 混合

Vsan分布式存储服务器数据恢复过程介绍

一.vsan分布式存储故障情况介绍 近期处理了一个vsan分布式存储的数据恢复案例,需要进行数据恢复的服务器是一套vsan超融合基础架构.由于客户的服务器供电异常导致异常关机,服务器管理员对服务器进行了重启,重启后发现vsan存储逻辑架构出现故障,虚拟磁盘文件丢失,虚拟机组件异常. 客户的vsan存储服务器里面一共搭配了16块硬盘,其中固态硬盘有8块,机械硬盘8块.固态硬盘主要作为缓存盘使用. 二.vsan分布式存储服务器数据恢复镜像备份 客户的服务器内存储了大量的重要数据,需要对存储进行数据恢

服务器raid5阵列故障排查及数据恢复过程记录

[服务器故障情况概述] 今天介绍的是服务器raid5阵列因为不明原因导致阵列崩溃后的故障排查方法,以及服务器数据恢复过程.下面简单介绍一下需要恢复数据的服务器硬件配置情况:本次数据恢复案例中的服务器型号为某品牌X3850型号,服务器上组建了一个raid5磁盘阵列,阵列里包含4块成员盘和1块热备盘一共5块.服务器再正常使用过成功突然崩溃,管理员查看raid阵列状态时发现阵列中有2块硬盘掉线,热备盘没有启用.需要从服务器层面进行数据恢复操作.·[服务器数据恢复普通流程]首先关闭服务器并保证在排查故障

某公司HP-EVA4400存储硬盘离线的数据恢复方法和数据恢复过程

一.故障描述 整个EVA存储结构是由一台EVA4400控制器,三台EVA4400扩展柜和28块FC 300G硬盘构成的.由于两块磁盘掉线导致存储某些LUN不可用,某些LUN丢失.由于EVA4400是因为某些磁盘掉线,从而导致整个存储不可用.因此接收到磁盘以后北亚工程师先对所有磁盘做物理检测,检测完后发现没有物理故障.接着使用坏道检测工具检测磁盘坏道,发现也没有坏道.磁盘坏道检测日志如下: 图一: 二.备份数据 考虑到数据的安全性以及可还原性,在做数据恢复之前需要对所有源数据做备份,以防万一操作不

服务器数据恢复案例_xfs数据丢失的数据恢复过程

简介:太原一家公司的服务器出现故障,服务器是linux服务器,连接了一台某型号的存储,文件系统为xfs文件系统.管理员使用xfs_repair工具试图对文件系统进行修复但修复失败,linux服务器中所有数据因此丢失.管理员在北京的数据恢复公司中选择了我们进行相关咨询,由于客户数据涉密且恢复难度较大,我们从北京总部派出服务器数据恢复工程师前往客户现场进行服务器数据恢复. 服务器数据恢复解决方案:为了不损毁客户丢失数据盘里的数据,数据恢复的第一步必须对客户的原始存储空间开进行镜像备份工作,数据备份完

Raid5磁盘阵列数据恢复,服务器raid数据恢复步骤和方法

[磁盘阵列数据恢复故障描述]客户的一台HP DL380 G4服务器,服务器使用hp smart array控制器挂载了一台国产磁盘阵列,磁盘阵列由14块146G SCSI硬盘组成一组RAID5.操作系统为LINUX,构建了NFS+FTP,作为公司内部文件服务器使用.由于服务器机房进行搬迁,搬迁过程中管理员顺便打扫了一下服务器和磁盘阵列设备,随后在新机房链接线路后服务器无法识别RAID,未做初始化. [对raid5阵列的初检结果]工程师对设备进行简单的初检,发现数据丢失的原因为raid信息丢失,H

分享一例EVA 4400存储硬盘故障数据恢复方案和数据恢复过程

EVA系列存储是一款以虚拟化存储为实现目的的HP中高端存储设备,平时数据会不断的迁移,加上任务通常较为繁重,所以磁盘的负载相对是较重的,也是很容易出现故障的.EVA是依靠大量磁盘的冗余空间,以及故障后rss冗余磁盘动态迁移来实现整个存储的数据保护,但随着越来越多的磁盘掉线,这种保护会接近临界,直至崩溃.下面以EVA存储故障为例,讲解EVA 4400存储数据恢复. 一.故障描述 整个EVA存储结构是由一台EVA4400控制器.EVA扩展柜及若干FC磁盘组成.由于磁盘故障导致存储中LUN不可用,致使

IBM V7000数据恢复过程;服务器数据恢复成功率分析

IBM V7000存储是一款定位中端的存储设备,很多企业选择该服务器作为存储,最近北亚数据恢复中心接到一例V7000服务器数据恢复案例,下面将对本次数据恢复的过程和数据恢复方法进行归纳总结,希望对各位管理员在服务器的运维工作有所帮助.服务器状态介绍:需要进行数据恢复的服务器故障表现为vdisk丢失,操作系统中的数据库无法正常使用.管理员重建MDisk,原来的raid10重建为raid6,然后又再次重建为riad10,这一系列的操作导致服务器对应的存储池中的VDisk丢失,从而影响上层Solari