云平台中节点异常如何考虑迁移因素

在云平台中物理节点异常是否立即迁移到其他可用资源节点?还是人为干预? 手动恢复异常节点的云主机...? 

自动迁移实现不难,难就难在如何定位故障?物理机异常有N种假设:

网络故障:交换机端口异常,广播风暴... 这种现象将会导致多节点异常?如果这种故障实现自动迁移将会带来意外风险

服务异常:MQ 消息积压,磁盘写满,将会导致所有节点无法正常通信,如果这种故障实现自动迁移带来意外风险

软件异常:后端存储节点服务down ,monitor 异常,将会导致云主机无法正常work, 如何定位VM 故障,是否迁移?

硬件故障:如果定位物理节点硬件故障,如硬盘故障,CPU Crash

时间: 2024-08-02 02:45:19

云平台中节点异常如何考虑迁移因素的相关文章

云平台中的可用性集

在Azure当中有地缘组的概念(http://maomaostyle.blog.51cto.com/2220531/1585696),之前的博文也提到过,这是一种提高"性能"或者说是尽可能减少系统间延迟的手段,是出于性能保障的,那么从可用性角度而言,就要提到"可用性集(Availability set)",Availability set是目前云平台上非常流行的一项"基本"功能,主要是提供一种高可用性的保障,在Azure当中对虚拟机提供最高99.

openStack 云平台管理节点管理网口流量非常大 出现丢包严重 终端总是时常中断问题调试及当前测试较有效方案

tuning for Data Transfer hosts connected at speeds of 1Gbps or higher <一.本次OpenStack系统调试简单过程简单记录> 1,dmesg 日志,丢包问题关键原因定位; [101231.909932] net_ratelimit: 85 callbacks suppressed 2,ethstatus -i p5p1 实时追踪网口TX/RX状态; 3,具体内核等相关参数调整 # recommended default co

Kolla部署Pike版本的OpenStack-allinone云平台

1 openstack 概述 openstack概述 : OpenStack是一个NASA美国国家航空航天局和Rackspace合作研发 的,以Apache许可证授权,并且是一个自由软件和开放源代码项目. Open是开放,Stack则是堆砌之意,合起来就是将众多的功能服务堆积起来的集合,让人们通过Openstack云计算项目,能够将诸如计算能力.存储.网络和软件等资源抽象成服务,以便让用户可以通过互联网远程来享用,付费的形式也变得因需而定,调整方便,拥有极强的虚拟可扩展性,是公共和私有云的建设与

容器云平台和Kubernetes之间不得不说的那些事

前言我们知道,传统的应用部署方式是将应用直接部署于单独的物理机或虚拟机中.但是在企业数字化转型的浪潮下,如何满足日益丰满的业务需求,如何高效践行敏捷研发,如何更好的将应用落地实施于客户现场,保障稳定高可用并利于维护,是传统企业不得不面对并解决的问题. 用友云技术中台为助力企业数字化转型提供了大量利器,比如本文将着重提及的容器云平台,就是其中之一. 容器云平台,是基于容器的运行时引擎,利用Kubernetes等容器调度方案,用以解决开发.测试.运行环境统一,服务快速部署,运行期服务管理.调度等问题

【转载】基于Docker的CaaS容器云平台架构设计及市场分析

[转自]http://www.cnblogs.com/darkprince/p/5115739.html 基于Docker的CaaS容器云平台架构设计及市场分析 ---转载请注明出处,多谢!--- 1 项目背景---概述: “在移动互联网时代,企业需要寻找新的软件交付流程和IT架构,从而实现架构平台化,交付持续化,业务服务化. 容器将成为新一代应用的标准交付件,容器云将帮助企业用户构建研发流程和云平台基础设施.缩短应用向云端交付的周期,降低运营门槛.加速企业向互联网技术和业务的双转型. 容器云将

智慧机械物联网云平台方案

伴随国内中高端机械设备公司业务的不断扩展,施工大型机械设备的应用率不断提高,同时设备分布越来越分散,大型设备的管理也越来越难:这也迫使机械设备的管理不断升级,然而传统的人到现场进行管理.维护已经远远不能满足公司的要求,高昂的人工成本.维护成本逐步成为公司发展的压力.甚至成为公司的发展瓶颈,因此采用设备的远程监控管理需求尤为迫切. 多比物联网云平台为资产密集型企业搭建远程集中监控.远程设备运维服务平台,提升资产运营效率.多比物联为生产运营企业提供人员.设备.信息互联平台,结合移动化解决方案,实现互

【原创】基于Docker的CaaS容器云平台架构设计及市场分析

基于Docker的CaaS容器云平台架构设计及市场分析 ---转载请注明出处,多谢!--- 1 项目背景---概述: “在移动互联网时代,企业需要寻找新的软件交付流程和IT架构,从而实现架构平台化,交付持续化,业务服务化. 容器将成为新一代应用的标准交付件,容器云将帮助企业用户构建研发流程和云平台基础设施.缩短应用向云端交付的周期,降低运营门槛.加速企业向互联网技术和业务的双转型. 容器云将对接各类代码托管库,实现自动化持续集成和DOCKER镜像构建,为新一代应用交付和开发运维一体化奠定了基础.

OpenStack(二)——使用Kolla部署OpenStack-allinone云平台

(1).Kolla概述 Kolla是OpenStack下用于自动化部署的一个项目,它基于docker和ansible来实现,其中docker主要负责镜像制作和容器管理,ansible主要负责环境的部署和管理. Kolla实际上分为两部分:Kolla部分提供了生产环境级别的镜像,涵盖了OpenStack用到的各个服务:Kolla-ansible部分提供了自动化的部署.最开始这两部分是在一个项目中的(即Kolla),OpenStack从O开头的版本开始被独立开来,这才有了用于构建所有服务镜像的Kol

【VMCloud云平台】SCO(三) 组件介绍

在上一篇,我们部署了SCO01,这是在VMCloud云平台中最关键的一个组件,正如第一章所说,这是System Center灵魂部件,这一章,我们来聊聊SCO上的各个组件分别起着什么作用(下图红色为部署中,紫色为实施完成,蓝色为计划中): 1. 我们打开SCO01,发现增加了四个组件,分别是Data Store Configuration.Deployment Manager.Orchestration Console.RunBook Designer: 2. 首先我们来看看Data Store