将Fault Tolerance功能与DRS配合使用

启用Enhanced vMotion Compatibility(EVC)功能,可以将vSphereFault Tolerance与vSphere Distributed Resource Scheduler(DRS)配合使用。此过程不但可使容错虚拟机受益于更好的初始放置位置,还可以将其纳入群集的负载平衡计算中。

当群集启用了EVC时,DRS将为容错虚拟机提出初始放置位置建议,在重新平衡群集负载期间移动这些虚拟机,并运行为主虚拟机分配DRS自动化级别(辅助虚拟机总是采用与其关联的主虚拟机相同的设置)。

在初始放置或负载平衡期间,DRS放置在主机上的主虚拟机或辅助虚拟机的数目不会超过一个固定的数目。此限制由高级选项das.maxftvmsperhost控制。此选项的默认值为4。但是,如果将此选项设置为0,DRS将会忽略此限制。

将vSphere Fault Tolerance用于禁用了EVC的群集中的虚拟机时,将为容错虚拟机指定DRS自动化级别“已禁用”。在这种群集中,每个主虚拟机只在其注册的主机上打开电源,其辅助虚拟机被自动放置,并且不会移动主或辅助容错虚拟机以进行负载平衡。

如果将关联性规则用于一对容错虚拟机,则虚拟机-虚拟机关联性规则仅适用于主虚拟机,而虚拟机-主机关联性规则则适用于主虚拟机及其辅助虚拟机。如果为主虚拟机设置了虚拟机-虚拟机规则,则DRS会尝试解决故障切换(即主虚拟机移动至新的主机)后出现的任何冲突。

时间: 2024-08-27 13:47:54

将Fault Tolerance功能与DRS配合使用的相关文章

HA功能与DRS配合使用

将vSphere HA与Distributed Resource Scheduler一起使用,可将自动故障切换与负载平衡相结合.这种结合会在vSphere HA将虚拟机移至其他主机后生成一个更平衡的群集. vSphere HA执行故障切换并在其他主机上重新启动虚拟机时,其首要的优先级是所有虚拟机的立即可用性.在虚拟机重新启动后,其上打开虚拟机电源的主机可能负载很重,而其他主机的负载较轻.vSphere HA使用虚拟机的CPU和内存预留来确定主机是否有足够的空闲容量容纳虚拟机.在结合使用vSphe

Apache Flink fault tolerance源码剖析(一)

因某些童鞋的建议,从这篇文章开始结合源码谈谈Flink Fault Tolerance相关的话题.上篇官方介绍的翻译是理解这个话题的前提,所以如果你想更深入得了解Flink Fault Tolerance的机制,推荐先读一下前篇文章理解它的实现原理.当然原理归原理,原理体现在代码实现里并不是想象中的那么直观.这里的源码剖析也是我学习以及理解的过程. 作为源码解析Flink Fault Tolerance的首篇文章,我们先暂且不谈太有深度的东西,先来了解一下:Flink哪里涉及到检查点/快照机制来

VMware Fault Tolerance 概述及功能

VMware Fault Tolerance - 为您的应用程序提供全天候可用性 通过为虚拟机启用 VMware Fault Tolerance,最大限度地延长数据中心的正常运行时间,减少停机管理成本.基于 vLockstep 技术的 VMware Fault Tolerance 可使应用程序实现零停机.零数据丢失,同时消除了传统硬件或软件集群解决方案的成本和复杂性. 1.消除因硬件故障造成的停机VMware Fault Tolerance 是一项前沿技术,它通过创建实际上与主实例保持同步的虚拟

vsphere Fault Tolerance 故障容错

Vsphere HA 与vsphere FT的对比 HA:通过在主机出现故障的时候重新启动虚拟机来为虚拟机提供基本级别的保护,提供快速恢复,减少非计划停机时间. 说明在虚拟机重新启动的时候有中断时间,存在宕机时间,还是不能保证服务的连续性,虚拟机重启的时间取决于虚拟机本身. FT: 为了解决HA存在的宕机时间,获得比vsphereHA所提供的级别更高的可用性和数据保护,从而确保业务连续性,消除中断时间. FT的基本机制: 通过创建和维护与主虚拟机相同,且可在发生故障切换时随时替换主虚拟机的辅助虚

Apache Flink fault tolerance源码剖析(三)

上一篇文章我们探讨了基于定时任务的周期性检查点触发机制以及基于Akka的actor模型的消息驱动协同机制.这篇文章我们将探讨Zookeeper在Flink的Fault Tolerance所起到的作用. 其实,Flink引入Zookeeper的目的主要是让JobManager实现高可用(leader选举). 因为Zookeeper在Flink里存在多种应用场景,本篇我们还是将重心放在Fault Tolerance上,即讲解Zookeeper在检查点的恢复机制上发挥的作用. 如果用一幅图表示快照机制

Fault Tolerance(FT)

vSphere Fault Tolerance通过创建和维护与主虚拟机相同,并且可在发生故障切换时随时替换主虚拟机的辅助虚拟机,来确保虚拟机的连续可用性,其实就是一为某一个虚拟机创建一个完全相同的副本.可以为虚拟机启用vSphere Fault Tolerance.比获得比vSphere HA所提供的级别更高的可用性和数据保护,从而确保业务连续性.Fault Tolerance时基于ESXi主机平台构建的(使用VMware vLockstep技术),它通过在单独主机上一虚拟锁步方式运行相同的虚拟

Apache Flink fault tolerance源码剖析(五)

上一篇文章我们谈论了保存点的相关内容,其中就谈到了保存点状态的存储.这篇文章我们来探讨用户程序状态的存储,也是在之前的文章中多次提及的state backend(中文暂译为状态终端). 基于数据流API而编写的程序经常以各种各样的形式保存着状态: 窗口收集/聚合元素(这里的元素可以看作是窗口的状态)直到它们被触发 转换函数可能会使用key/value状态接口来存储数据 转换函数可能实现Checkpointed接口来让它们的本地变量受益于fault tolerant机制 当检查点机制工作时,上面谈

Flink Program Guide (9) -- StateBackend : Fault Tolerance(Basic API Concepts -- For Java)

State Backends 本文翻译自文档Streaming Guide / Fault Tolerance / StateBackend ----------------------------------------------------------------------------------------- 使用Data Stream API编写的程序通常以多种形式维护状态: ·  窗口将收集element或在它被触发后聚合element ·  Transformation方法可能会

Apache Flink fault tolerance源码剖析(四)

上篇文章我们探讨了Zookeeper在Flink的fault tolerance中发挥的作用(存储/恢复已完成的检查点以及检查点编号生成器). 这篇文章会谈论一种特殊的检查点,Flink将之命名为--Savepoint(保存点). 因为保存点只不过是一种特殊的检查点,所以在Flink中并没有太多代码实现.但作为一个特性,值得花费一个篇幅来介绍. 检查点VS保存点 使用数据流API编写的程序可以从保存点来恢复执行.保存点允许你在更新程序的同时还能保证Flink集群不丢失任何状态. 保存点是人工触发