物理机宕机虚拟机切换到另一台物理机上继续运行。如果是虚拟机死机,则利用高可用再对虚拟机进行重新配置。
如我们以前学习的STP(生成树协议)也是实现高可用的群集
高可用性实现的方面:(主要分为4个方面)
1、应用层高可用性:实现sql server、mysql等一些服务程序的群集,判断应用程序是否正 常运行。
2、操作系统高可用性:对操作系统的群集,操作系统是运行服务的平台,主要就是对其服 务程序做高可用。
3、虚拟化层的高可用性:HA、FT 通过提供中断快速恢复和连续可用性来最小化或消除非 计划停机时间。
4、物理层的高可用性:网卡、存储的冗余
使用vsphere可以:
1、独立于硬件、操作系统、和应用程序提供更高可用性。不需要特殊配置。
2、减少常见维护操作的计划停机时间
3、在出现故障时提供自动恢复。
像解决单点故障的实例有很多:
以太网通道(交换机)
HSRP(热备份路由协议 路由器)
vsphere高可用性(虚拟化)
一、VSphere HA 提供快速中断恢复
群集(多台主机构成的集合,主机至少需要两台)
将主机群集,实现为虚拟机中运行的应用程序提供快速恢复和具有成本效益的高可用性。
HA通过以下方式实现高可用性:
- 通过在群集内的其他主机上重新启动虚拟机,防止服务器故障-------物理主机
- 通过持续监控虚拟机(通过vmtools发送检测消息),在出现故障的时候进行重新配置,防止应用程序故障。-------虚拟机
vsphereHA的特点:
1、无需在应用程序或虚拟机内安装特殊软件,所有工作负载均自动受到HA保护。
2、HA与DRS结合防止出现故障,在群集内实现负载均衡。
DRS 分布式资源调度分配程序
HA群集允许ESXI主机集合作为一个组协同工作,比单台主机提供的级别要高。
群集中的主机都会受到监控,如果发生故障,故障主机上的虚拟机在备用主机上重新启动。
在群集中有两个角色:
首选主机 master
从属主机 slave
凸^-^凸 与我们之前学的ospf中的DR与BDR相似,没有占先权
竞选首选主机的条件:
- 群集中的主机都会参与竞选(除了处于待机状态、维护模式、断开连接的主机),根据挂载数据存储的数量。------可能性大
- 谁先加入群集中
每个群集中只存在一台首选主机,其他的所有主机都是从属主机。如果master出现故障、关机或从群集中移除,则会进行新的选举。
然而首选主机的工作量也大:
- 监控从属主机的状况,如果出现故障或无法访问,master确定哪台虚拟机需要重新启动。
- 监控所有受保护的虚拟机(虚拟机状态为on)的电源状况。
- 管理群集主机和受保护的虚拟机列表,维护着群集内的清单。
- 缓存cluster(群集)的配置,master通知提醒slave主机。
- master主机发送心跳消息给slave主机,如果slave主机收不到心跳消息了,则重新竞选新的首选主机。
- master报告状态信息给vcenter,vcenter正常情况下只与master主机通信。虚拟机保护,保证在出故障的时候重启虚拟机。
相反从属主机的任务只有3个:
- 监视本地运行的虚拟机状态,把变化发送给master主机。
- 监视master主机的健康状态,如果主机出现故障,slave参与master的竞选
- slave运用HA接入控制功能,不需要master的协调。
接入控制:
群集内有足够的资源(cpu、内存资源),才能进行故障切换
而且确保当前虚拟机资源可用。
主机故障类型和检测
master和slave互相发送心跳消息。
在HA群集中,检测三种类型的主机故障有:
- 主机停止运行(发生故障)
- 主机与网络隔离-----网络隔离
- 主机失去与首选主机的网络连接-----网络分区
检测途径:可以通过管理网络、存储网络
当master通过管理网络联系不到slave时,不一定说明slave出问题了,master会通过存储网络来检查slave是否还存活。