vsan存储服务器非正常关机导致虚拟机故障解决方法

Vsan是一种以vSphere内核为基础进行开发、可扩展的分布式存储架构,Vsan通过在vSphere集群主机当中安装闪存和硬盘来构建vsan存储层,这些设备由vsan进行控制和管理,vsan形成一个供vSphere集群使用的统一共享存储层。
vSphere提供了HA功能,保证单台主机故障后业务可以在其他的主机上运行,同一个虚拟机的同一份数据,必须保存在不同主机上,也允许有主机故障。但是如果多台主机同时故障的话,就会导致整个vsan存储崩溃,一般突然断电或者非正常关机就会导致虚拟机故障,下面就是非正常关机导致虚拟机故障的恢复方式。
·
故障环境为一套VMWARE VSAN 的超融合基础架构,共包含三台服务器节点。每台服务器节点上配置2块200G容量的SSD硬盘和4块1T容量的机械硬盘,共6块SSD硬盘和12块机械硬盘。
每个服务器节点上创建两个磁盘组,每个磁盘组使用1个SSD硬盘作为缓存盘,2个机械硬盘作为容量盘,共配置6个磁盘组,组成VSAN存储空间存储虚拟机文件。
在使用过程中,由于非正常关机,导致VSAN中,逻辑架构出现故障,部分虚拟机磁盘组件出现问题,导致磁盘文件丢失。
·

一.磁盘镜像和故障检测

为防止在数据恢复过程中由于部分操作对原始磁盘造成不可还原的修改,导致数据出现二次丢失, 对原始磁盘进行镜像备份。
将VSAN的节点服务器上所有硬盘编号拆出,接入到备份服务器中,使用WinHex软件对所有硬盘进行底层的逐字节镜像备份。
获取到客户三台节点服务器上的所有硬盘的底层镜像,共18个镜像文件。
对全部镜像文件进行分析扫描,发现故障虚拟机的元数据和组件信息没有严重损坏和丢失的情况,保留较为完整,有很大的把握可以完整恢复。
·

二.恢复方案

1、扫描组件信息。
因为VSAN中所有文件以对象的方式存在,而每个对象会被分割为多个组件,扫描所有组件信息,组件信息中记录组件ID和该组件属于哪个对象的对象ID等信息。编写程序扫描组件信息。
2、提取组件。
根据组件中的信息,找到每个数据块和该块在组件的逻辑位置,编写程序提取完整组件。
3、合并VMDK文件。
根据组件信息中的描述信息将组件按照描述信息中记录的RAID级别和各个组件在对象中的逻辑位置进行组合,拼接出完整的对象,即完整的vmdk文件。
4、刷新缓存盘数据。
每个组件可能会有部分数据留在缓存盘上,并没有写入到容量盘中,编写程序将缓存盘上的数据刷新到对应的组件或对象中。
5、合并快照。
对于有快照的vmdk文件,将快照和父盘进行合并。
6、解析vmdk,恢复文件。
将合并完成后的vmdk文件进行解析,并提取其中SQL server 2008 R2数据库的备份文件。
7、数据库还原和检测。
安装SQL server 2008 R2数据库,将提取完成的数据库备份文件进行还原操作,还原过程没有任何报错,成功还原后使用dbcc命令检查数据库完整性,检查完成无任何报错。

原文地址:https://blog.51cto.com/sun510/2461761

时间: 2024-08-03 14:57:27

vsan存储服务器非正常关机导致虚拟机故障解决方法的相关文章

VPS服务器升级原则及故障解决方法

随着信息化建设的飞速发展,很多企业意识到自己的服务器已经不能满足自己发展的需要了.某公司服务器会经常出现宕机等情况,其原因是服务器不能承担更多的用户访问数量.还有处理器因为过于陈旧会出现资源占用率过高的情况.而且旧机器成本更高,所以需要对VPS服务器进行升级.我们需要注意升级的原则以及故障解决方法. 一.服务器升级原则 1. 服务器升级的目的是解决系统某一方面的瓶颈,但是升级的结果不能造成新的系统瓶颈. 升级时应该考虑针对的是服务器哪一方面的瓶颈,但是从应用来说,不能因为简单的升级某一部件,而造

Windows10系统笔记本电脑点击关机变休眠的解决方法

现在,从Win7/8/8.1系统升级到Win10系统的用户已经非常多了,但是一些使用笔记本电脑的用户反馈,升级后电脑开关机就变得不正常了.在win10系统中,点击关机,无法关机进入休眠模式:点击重启计算机,电脑却关机了,这该是怎么回事呢?其实,该问题是由于电源管理驱动与新版Win10系统不匹配导致的,下面就给大家分享下解决方法. 步骤如下: 1. 在度娘找到自己本本的官网,这里以联想为例,搜索联想,点击联想官网(在搜寻结果后面带“官网”两字): 2.点击驱动下载,按照自己本子的型号进行选择: 3

NFS服务的简介及常见故障解决方法

NFS服务的简介及常见故障解决方法 1.NFS基本介绍 (1)NFS简介 NFS 是Network File System的缩写,即网络文件系统.一种使用于分散式文件系统的协定,由Sun公司开发,于1984年向外公布.功能是让客户端通过网络访问不同主机上磁盘里的数据,主要用在类Unix系统上实现文件共享的一种方法.NFS在文件传送或信息传送过程中依赖于RPC协议. (2)NFS服务需要安装的软件 nfs-utils-* :包括基本的NFS命令与监控程序 rpcbind-* :支持安全NFS RP

阿里云提出的漏洞(Phpcms V9某处逻辑问题导致getshell漏洞解决方法)的问题

最近从阿里云云盾检测流出来的,相比使用阿里云服务器的朋友已经收到漏洞提醒:Phpcms V9某处逻辑问题导致getshell漏洞解决方法,这个漏洞怎么办呢?CMSYOU在这里找到针对性解决办法分享给大家. 漏洞详情: 漏洞名称:phpcms某处逻辑问题导致getshell 补丁编号:7843523 补丁文件:/phpcms/libs/classes/attachment.class.php 补丁来源:云盾自研 更新时间:2016-09-20 13:03:10 漏洞描述:phpcms的/phpcm

winform频繁刷新导致界面闪烁解决方法

转自龙心文 原文 winform频繁刷新导致界面闪烁解决方法 一.通过对窗体和控件使用双缓冲来减少图形闪烁(当绘制图片时出现闪烁时,使用双缓冲) 对于大多数应用程序,.NET Framework 提供的默认双缓冲将提供最佳效果.默认情况下,标准 Windows 窗体控件是双缓冲的.可以通过两种方法对窗体和所创作的控件启用默认双缓冲.一种方法是将 DoubleBuffered 属性设置为 true,另一种方法是通过调用 SetStyle 方法将 OptimizedDoubleBuffer 标志设置

XCode编译文件过多导致内存吃紧解决方法

XCode编译文件过多导致内存吃紧解决方法 /Users/~~/Library/Developer/Xcode/DerivedData 1) 然后 找到编译文件 删除 就好了哦 快去试试看吧

Win7 网络打印机脱机故障解决方法

刚好遇到这个问题,把解决方法保存一下,方便以后查找 操作系统: win7 现象: 使用共享打印机器打印文档时,发现打印机没有反应. 查看打印机队列,有打印内容. 打印测试页没有反应 本机网络连接正常 打印机和打印服务器(PC机)连接正常,打印服务器能正常打印 打印机状态显示为脱机 原因: 登录打印机凭证丢 操作系统:win7 现象: 使用共享打印机器打印文档时,发现打印机没有反应. 查看打印机队列,有打印内容. 打印测试页没有反应 本机网络连接正常 打印机和打印服务器(PC机)连接正常,打印服务

windows由于上次没有正常关机导致的错误解决

像往常一样,打开电脑准备新一天的码农生活,在持续了近两分钟的开机时间后自启动的AnyConnect首先报错:AnyConnect not available,以为是电脑管家禁止了其自启 并且发现桌面90%快捷方式都是类似于下图的样子(仅限于图标) 接着打开QQ,弹出错误框,内容:initialization failure:0x0000000C 伴随着的是电脑极度卡,多数联网软件无法正常使用.百度后发现问题是:上次没有正常关机导致的错误,具体错误不明. 解决方法:管理员运行cmd,输入 nets

实例讲解vsan分布式架构虚拟磁盘文件丢失的解决方法

········VSAN是一种应用于服务器.存储的以vSphere内核为基础进行开发.可扩展的分布式存储架构.VSAN通过在服务器vSphere集群主机当中安装闪存和硬盘来构建VSAN存储层.这些设备由VSAN进行控制和管理,VSAN形成一个供vSphere集群使用的统一共享存储层.同其他服务器架构一样,vsan也会出现故障导致服务器数据丢失,今天为大家介绍一例由于服务器异常断电导致vsan逻辑架构异常.虚拟磁盘文件丢失的数据恢复成功案例.· 一.服务器数据恢复故障描述 ········本次介绍