vsphere Fault Tolerance 故障容错

Vsphere HA 与vsphere FT的对比

HA:通过在主机出现故障的时候重新启动虚拟机来为虚拟机提供基本级别的保护,提供快速恢复,减少非计划停机时间. 说明在虚拟机重新启动的时候有中断时间，存在宕机时间，还是不能保证服务的连续性，虚拟机重启的时间取决于虚拟机本身。

FT: 为了解决HA存在的宕机时间，获得比vsphereHA所提供的级别更高的可用性和数据保护，从而确保业务连续性，消除中断时间。

FT的基本机制：

通过创建和维护与主虚拟机相同，且可在发生故障切换时随时替换主虚拟机的辅助虚拟机，形成虚拟机对。

可以为大多数任务关键虚拟机启用FT，并会创建一个重复虚拟机（辅助虚拟机），它会以虚拟锁步（vlockstep）方式随主虚拟机一起运行。

vlockstep：可获捕主虚拟机上发生的输入和事件，并将这些输入和事件以日志记录的方式发送到正在另一主机上运行的辅助虚拟机。主虚拟机的操作会随时同步到辅助虚拟机上。它可以无中断地接管任何点处的执行，提供容错保护。

主虚拟机和辅助虚拟机可持续交换检测信号，使得虚拟机对中的虚拟机能够监控彼此的状态。

如果运行主虚拟机的主机发生故障，系统会自动执行透明故障切换，会立即启用辅助虚拟机替换主虚拟机，同时在几秒内建立冗余
如果运行辅助虚拟机的主机发生故障，则该主机也会立即被替换。

主虚拟机和辅助虚拟机总是成对出现。

用户感觉不到服务中断和数据丢失的情况。

主虚拟机及其辅助副本不允许在相同的主机上运行。

FT不支持的vsphere的功能：

1、快照。在虚拟机上启用FT前，必须移除快照。不能对已启用的FT的虚拟机执行快照。

FT和快照不能同时存在。

2、Storage vmotion：不能为已启用FT 的虚拟机调用svmotion，若要迁移存储器，应但暂时将FT关闭，再进行操作。

3、链接克隆：(用于桌面虚拟化环境)不能为链接克隆的虚拟机上启用FT，相反一样的道理。

只能做完全克隆。

4、虚拟机备份：不能使用storageAPI for Data Protection 、VDR（做静默快照）或需要使用虚拟机快照的备份产品来备份启用了FT的虚拟机。

FT与DRS配合使用

比如：有三台主机A B C，A为主虚拟机，创建辅助虚拟机时选择B或C就是DRS的工作。根据哪台物理资源比较合适，就选哪台。

FT群集要求

1、主机证书检查功能已启用。

2、至少有两台通过FT认证的主机运行相同的FT版本号或主机内部版本号。

3、esxi主机必须有共享存储，并且主机都可以访问。

4、配置FT日志记录、vmotion网络。

5、HA群集已创建并启用。

主机要求：

1、主机的cpu处理器必须来自与FT兼容的处理器组。处理器之间要兼容。可以上微软或vmware官网上去查看。

2、每台主机，在BIOS中启用硬件虚拟化（HV）

虚拟机的要求：

1、虚拟机必须存储在虚拟RDM或厚置备的虚拟机磁盘（VMDK）文件中。

精简置备：实际占用多少就多少虚拟机实际占用的磁盘大小，最大不能超过主机分配的大小。

厚置备：主机分配的大小是多少就是多少。

2、虚拟机文件必须存储在共享存储上。

3、只有带有单个VCPU的虚拟机才能与FT功能兼容。单核，当大于等于2时被阻止启用FT。

将主机添加到群集中，有两种方式：

1、直接拖进去

2、右击群集然后添加主机

没有在共享存储上的虚拟机，开启FT之后，两台虚拟机会在同一台主机上。

份额：2台或多台虚拟机在竞争同一个cpu或内存资源时，份额越大，资源分的越多。

预留：比如说预留为500M则虚拟机确保在启动时，群集满足虚拟机的最小内存。

如果主机可用资源小于虚拟机预留资源时，虚拟机不能启动。当启用FT之后，自动会设置预留，关闭FT之后需要手工将预留关闭。

限制：最大值限制

时间： 2024-07-31 19:17:10

vsphere Fault Tolerance 故障容错

vsphere Fault Tolerance 故障容错的相关文章

Fault Tolerance（FT）

将Fault Tolerance功能与DRS配合使用

Fault Tolerance —— Storm的故障容错性

Flink Program Guide （7） -- 容错 Fault Tolerance（DataStream API编程指导 -- For Java）

VMware Fault Tolerance 概述及功能

Practical Byzantine Fault Tolerance

Flink Program Guide （9） -- StateBackend : Fault Tolerance（Basic API Concepts -- For Java）

Apache Flink fault tolerance源码剖析(四)

Apache Flink fault tolerance源码剖析(一)