苏州某公司FreeNAS+ESXi5故障 数据丢失

苏州某公司FreeNAS+ESXi5故障 数据丢失

【物理与逻辑存储】

此公司使用一种廉价的存储模式,用iSCSI方式来达到FC SAN的功能。

物理存储构架在一台 DELL 服务器上,使用 FreeNAS 来做 iSCSI,然后使用两台 DELL 服务器做ESXi5.0 的虚拟化系统。

FreeNAS 层为UFS2文件系统,整个存储建一个稀疏模式的文件,挂给ESXi5.0 系统。

ESXi系统内跑有5台虚拟机,其中有三台最为重要。

一台windows2003系统虚拟机是此公司在当地的门户网站。使用 ASP.net和 PHP 混合构架,使用数据库为 SqlServer2005和 mysql 5.1 。

一台为FreeBSD 系统,跑有 Mysql数据库,供其它多台虚拟机使用。

一台为windows2003服务器,存储此公司新开发的程序代码。

【故障现象】

在一次存储突然断电之后,ESXi系统连不存储,管理员在FreeNAS中发现UFS2文件系统出现问题,然后管理员用fsck 修复好了文件系统,此时 ESXi 系统已能连上存储,但发现ESXi系统未能识别到原来的数据存储和VMFS文件系统,管理员格式化VMFS后,发现里面空无一物。

【数据恢复过程】

客户找到了几家数据恢复公司,耗时一个星期,仍无结果。事情太过于复杂。

后经上海某运维公司介绍,客户联系上了北京北亚数据恢复中心。

在进行详细沟通后制定了一个详细的数据恢复方案,经客户认可后工程师直接飞往苏州进行数据恢复。

分析故障,最大化利用可用信息。

开始抽丝剥茧:

应用构架层次:FreeNAS(UFS2文件系统–> 一个大的稀疏模式的文件) –> ESXi 5.0(VMFS文件系统层) -> 单台虚拟机的虚拟磁盘 (windows-NTFS文件系统/FreeBSD-UFS2文件系统)。

第一步是镜像 FreeNAS 层,然后分析整个存储,发现就一个900多GB的大文件,文件名: iscsidata。

通过UFS2文件系统的二进制结构,定位到 iscsidata 文件的Inode数据,发现此文件被重建过,inode指针指向的数据量很少。

FreeNAS层无法解决,就无法进入到下一步的 VMFS层分析。

收集UFS2文件系统的重要结构:

块大小:16KB

Segment 大小:2KB

柱面组大小:188176 KB

UFS2一个数据指针占 8字节,一个块可存储 2048个数据指针。

那么一个二级指针块则可存储:2048*2048*16KB= 64GB 数据。

一个三级指针块则可存储 64GB*2048= 128TB 数据

如果能找到 iscsidata 文件的三级指针块就能解决 FreeNAS层问题。

但iscsidata文件重建过,过程和大小都和原始的一样,估计有部分指针块已被覆盖。

原始 iscsidata 文件的 inode和新建的 iscsidata 文件的 inode 就在一个位置,尝试进行搜索,无其它有用的inode出现。

只得现场写程序收集有用的指针块:

图一:

由于iscsidata文件是使用稀疏模式,收集条件只能放宽,收集到了大量三级指针块和二级指针块。对收集到的所有三级指针块进行分析,都是无效的,无iscsidata文件使用的三级指针块,估计在新建iscsidata文件时被新的覆盖(新的iscsidata文件在挂载到ESXi5.0后有个VMFS格式化过程,而 ESXi5.0 使用GPT分区,GPT分区会在磁盘最后写入冗余的GPT头和分区表信息数据,这样会使用iscsidata文件的三级指针块)。

现只能分析收集到的二级指针块,对有大量的二级指针块的指向数据进行DUMP,然后再从磁盘中的数据定位到二级指针。

这样得到大量DUMP的数据。

开始分析 VMFS 层:

重格式化过VMFS,和原始UFS2的指针已丢失,造成VMFS元文件已基本上不可用,无重要的参考信息,所幸虚拟机都无快照,仍可恢复。

通过 单台虚拟机层(windows(NTFS)和 FreeBSD(UFS2)系统的文件系统结构),向上定位到VMFS层,在通过VMFS层定位到DUMP出的单个64GB 文件,通过多次组合,最终这三台重要的虚拟机的虚拟磁盘都已完全恢复。

客户将恢复出的网页数据和数据库数据上传到一新构建的系统中,拉起应用,数据完全无问题。

图二:

【数据恢复结果】

耗时2天,最终数据100% 恢复成功。

【数据恢复基本服务】

1. 免费检测

2. 与客户签订保密协议,对客户的数据严格保密

3. 数据恢复不成功不收费

4. 专业工程师提供服务

5. 数据恢复前报价,客户确认后工程师开始数据修复

6. 整个恢复过程不会对客户的原盘有任何的写操作,以确保原盘的数据完全

时间: 2024-10-15 19:59:17

苏州某公司FreeNAS+ESXi5故障 数据丢失的相关文章

苏州FreeNAS+ESXi5数据恢复案例

苏州FreeNAS+ESXi5数据恢复案例 [物理与逻辑存储] 此公司使用一种廉价的存储模式,用iSCSI方式来达到FC SAN的功能. 物理存储构架在一台 DELL 服务器上,使用 FreeNAS 来做 iSCSI,然后使用两台 DELL 服务器做ESXi5.0 的的虚拟化系统.FreeNAS 层为UFS2文件系统,整个存储建一个稀疏模式的文件,挂给ESXi5.0 系统.ESXi系统内跑有5台虚拟机,其中有三台最为重要. 一台windows2003系统虚拟机是此公司在当地的门户网站.使用 AS

FreeNAS+ESXi5数据恢复过程+虚拟化数据恢复方法

[背景简介] 故障发生在苏州的一家公司,此公司使用一种廉价的存储模式,用iSCSI方式来达到FC SAN的功能.物理存储构架在一台 DELL 服务器上,使用 FreeNAS 来做 iSCSI,然后使用两台 DELL 服务器做 ESXi5.0 的的虚拟化系统.FreeNAS 层为UFS2文件系统,整个存储建一个稀疏模式的文件,挂给ESXi5.0 系统.ESXi系统内跑有5台虚拟机,其中有三台最为重要.一台windows2003系统虚拟机是此公司在当地的门户网站.使用 ASP.net和 PHP 混合

FreeNAS+ESXi5异常断电,ESXI系统无法连接存储

[存储服务器介绍] 发生故障的服务器存储为常见存储模式,物理存储为一台Dell服务器,虚拟化系统为esxi5.0.上层采用iSCSI方式实现FCSAN功能,上层的iSCSI是使用FreeNAS构建的.·服务器的FreeNAS层采用了UFS2文件系统,虚拟化系统里有3台虚拟机,本次服务器数据恢复的重点就是这三台虚拟机.其中一台虚拟机采用的是FreeBSD 系统,存储的是数据库文件,另外两台分别存储了网站数据和Windows2003服务器,存储的是数据库数据和工作程序代码.· [存储服务器故障发生过

小型公司案例 -- 局域网故障排查

查找该案例中的错,实现全网互通. 该案例中一共九处错误: 1.PC0与PC1不再同一网段. PC0: PC1: 2.SW1的Fa0/1口没做access链路. 3.SW1的Fa0/23口没有允许Vlan 10通过 4.SW2上Fa0/23口没有允许Vlan 10通过 5.SW2上Fa0/22,Fa0/24口没有做trunk链路 6.SW3上Fa0/1口没有开启,也没有做access链路 7.SW3上Fa0/22口,Fa0/23口的链路捆绑组和SW2上不一致 8.SW2上没有创建Vlan 10 9

公司突然断网故障排查

记一次公司断网故障排查 本来大周一挺好的,刚坐在工位上不到半个小时,公司突然断网,此时,我是有点凌乱的! 下边是排查故障的过程 1,首先我看下本机电脑的IP地址,禁用启动,发现仍旧可以获取到IP地址,这代表DHCP分发是没问题的,因为是突然断网,代表着交换机路由器配置不可能出问题 2,接着我带着笔记本进入机房,看了下光猫,光猫状态正常,然后看了下路由器,路由器是H3C的,有web管理界面,进入web管理界面,发现IP地址状态也是正常的. 4,接着给公司网络运营商打电话,他说是他们那边的问题,有个

苏州地区--校招IT公司

完整经历了苏州的秋招和春招,在本校和苏州大学跑了许多次的宣讲会,自认为对苏州IT企业的校招有一个充分的认知.原本打算在苏州找一份Java开发的工作,可是发现自己简历连那些公司的简历关都过不去(对双非学校也太不友好了吧!) 本帖适合:苏州高校寻找互联网或IT企业的同学,介绍主要企业为,苏州IT公司,包括互联网公司和工业公司. 贴图:转自校招薪水(微信公众号) 介绍本人知道和了解的一些IT公司:(面向校招) 1.微软苏州:苏州地区顶尖的IT公司,每年都有春招实习和秋招的岗位,开发和研发都有. 2.同

设备受损或故障可扫码报修

广州日报讯 (全媒体记者蒋偲)为实现对数量庞大的城市道路交通基础设施高效管养,深圳市交通运输局昨日透露,计划在年底前,给大部分交通设施贴上"二维码",市民只要扫码就能查看设施基本信息.评价或者报修. 根据计划,今年6月30日前,深圳全市高快速路将完成二维码安装:8月31日前,福田区.南山区桥梁.隧道.边坡挡墙.通道.其他道路的二维码将完成安装:12月31日前,其他8个区的桥梁.隧道.边坡挡墙.通道.其他道路的二维码也将完成安装. 据介绍,目前市交通运输局承担着全市9437条道路.317

百威商超收银软件数据库置疑修复

上海某大型超市,使用了百威收银软件,某日突然断电造成帐套无法进入,经过检查发现是SQL2000数据库置疑,索引损坏,后联系软件经销商,经销商无法处理,联系到我们.因为数据库的损坏,严重影响到超市的正常营业,生鲜,熟食等没有办法调价格,造成很大的损失,我们的工程师,加班加点,终于在晚上下班前修复成功! [数据库置疑故障现象] SQL2000数据库置疑造成百威收银软件帐套无法进入 [数据库置疑数据恢复方法] 重建索引修复成功!修复好的库引入到百威软件里,查询和使用所有模块均无报错,SQL2000数据

NoSQL数据库介绍(2)

2 NoSQL潮流 在这一章中,将一起讨论NoSQL潮流的动机和主要驱动力,以及NoSQL主张的批评和反馈.本章将通过不同的尝试得出结论来分类和描述NoSQL数据库.其中一个分类法将在随后的章节中被提出. 2.1 动机和主要驱动力 NoSQL这个词汇首先用在1998年对关系数据库排除SQL使用的论文([ Str10 ]).这个词在2009年再次被选出来,并用于非关系数据库拥护者(如Last.fm的开发者Jon Oskarsson,他组织了三藩的NoSQL见面会)的会议([ Eva09a ]).一