1、高可靠性系统一个至关重要的方面是消除单点故障SPOF。SPOF是指能够导致系统宕机或者数据丢失的单个设备或者软件的故障。为了消除单点故障,需要检查以下几个结构的冗余性:
网络模块,比如交换机和路由器
应用和服务的自动迁移
存储模块
机房设施,如电源,空调,防火
大多数高可靠系统在多个非独立故障发生时会失效。典型的高可靠系统能够达到99.99%甚至更高的可靠性,意味着一年最多只能有一个小时的宕机时间,为了达到这个目标,高可靠系统需要实现在故障发生后1到2分钟内恢复。
对于openstack的基础服务来说能够达到上述要求,即openstack能够达到99.99%的可靠性。尽管如此,对于单个客户实例来说,openstack不保证99.99%的可靠性。
高可靠性取决与服务是否是无状态的。为了使无状态服务具备高可靠性,需要为无状态服务建立冗余实例。openstack的无状态服务包括nova-api,nova-conductor, glance-api, keystone-api, neutron-api和nova-scheduler。openstack的有状态服务包括数据库和消息队列。有状态服务的高可靠性取决于是否选择主从部署或者双活部署
http://docs.openstack.org/high-availability-guide
时间: 2024-10-22 14:45:39