ECS主动运维2.0,体验升级,事半功倍

摘要: 阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。基于主动运维2.0,您使用ECS云服务器的体验更加流畅,而且利用系统事件,不再依赖于工单联系客服,可以通过自助处理的方式响应主动运维实例重启,减少对系统可靠性和业务连续性的影响。

云服务器 ECS(Elastic Compute Service)是一种弹性可伸缩的计算服务,助您降低 IT 成本,提升运维效率,使您更专注于核心业务创新。当您基于ECS云服务器搭建了业务系统,借助云计算的诸多优势和特性,可以实现对业务需求的敏捷响应和对业务连续性的有力保障。在此基础上,阿里云致力于提供更好用的运维体验,让您使用ECS的过程更透明、高效,并实现更加标准化、自动化的运维方式。

主动运维

阿里云使用严格的IDC标准、服务器准入标准以及运维标准,保证云计算整个基础框架的高可用性、数据的可靠性以及云服务器的高可用性。对于单台ECS实例, 阿里云承诺一个服务周期内单台ECS实例的服务可用性不低于99.95%;对于单地域多可用区,阿里云承诺一个服务周期内该单地域多可用区的服务可用性不低于99.99%。

我们知道,在基础设施层面,始终存在一些潜在因素如软件bug或硬件故障等会影响ECS实例的运行,因此为了保证上述高级别的服务可用性,除了云计算基础框架的高可用性设计以外,ECS主动运维不可或缺。主动运维作为ECS的隐形卫士,会主动对承载ECS实例运行的物理服务器做日常维护和故障检测,并尽可能通过在线或轮转升级的方式修复潜在的故障隐患,以持续提升系统可靠性、性能和安全防护能力,保障云服务器稳定运行。

但对于某些情况,物理服务器需要重启或停机维护,这时主动运维系统会向该服务器上的ECS用户发送消息通知,提示您的ECS实例需要重启迁移至健康的物理服务器之上。此前,用户接到这样的通知后需要提交工单联系客服人员授权处理,随着主动运维2.0的进化,这方面的体验得到多方面的提升。

体验升级

1. 主动运维热迁移,实例运行不中断

当主动运维检测到物理服务器存在故障风险时,系统会优先尝试将该服务器上的ECS实例在线热迁移至其他物理服务器,热迁移成功的实例不会中断运行,其业务可以保持在线;只有少量热迁移存在风险的实例才会进入主动运维重启迁移流程。此策略升级后,有效减少对用户业务连续性的冲击,在阿里云用户规模快速增长的情况下,主动运维相关工单数量同比下降125倍!

2. 风险提示更清晰,迁移影响提前知

对于有必要进行重启迁移的实例,阿里云会提前向用户发送消息通知和针对性的提示。由于本地存储(本地盘)来自单台物理服务器,不基于多副本分布式技术,在迁移时本地盘所存储数据会被擦除,因此对于本地盘实例,通知中明确提示该风险并提醒您在迁移前及时备份数据。对于云盘实例,通知中提供操作引导,您不再需要提交工单联系客服人员,可以直接在控制台或通过API处理实例重启迁移。

3. 不用工单找客服,系统事件来帮忙

云盘实例重启迁移的自助处理功能在控制台和API上线,当您受到重启迁移的系统计划事件时,可以知晓该事件的执行计划。如下图所示,根据您的业务需要,可以选择立即执行重启、预约在业务低峰期执行重启、或等待系统按计划执行,做有准备的运维操作。这样的过程不再需要依赖工单处理,提高效率的同时减少实例重启对您在行业务的冲击。

事半功倍

正如上面提到的体验改进,“事”半功倍,除了主动运维流程进化,还来源于系统事件的发布。系统事件有利于提升用户对于ECS运行状态变化的感知,并进行有针对性的操作来响应或规避事件对在行业务的影响。通过系统事件的闭环,将更多的运维场景标准化、自动化,让用户获得更好的额云上运维体验。

原文链接

阅读更多干货好文,请关注扫描以下二维码:

原文地址:http://blog.51cto.com/13679539/2105822

时间: 2024-10-29 22:50:24

ECS主动运维2.0,体验升级,事半功倍的相关文章

运维 2.0 时代:数据聚合和分组

运维 2.0 时代:数据聚合和分组 from http://www.cnblogs.com/oneapm/p/4962111.html 运维 2.0 是指,从技术运维升级为服务运维,向公司提供可依赖的专业服务.运维 2.0 强调服务交付能力,而不是技术能力,需求可依赖.懂业务.服务化的专业运维. 为了了解运维 2.0 时代的监控方式,我们不妨从以前的监控手段说起.首先来了解一下 Zabbix ,通过 Zabbix 能够监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以让系统管理员

运维之扩容与升级

本文我们将对Kubernetes的常用运维操作扩容与升级做简单说明. 1.Node的扩容 Node的扩容简单言之就是增加新的Node节点.在节点上安装Kubelet,Kube-proxy及Docker, 并修改参数使其指向Master地址.基于Kuberlet的自动注册机制,新的Node将会自动加入现有的Kubernetes集群中. 2.Pod的动态扩容和缩放 在实际运维过程中,我们常常需要对某个服务动态扩容以满足突增的流量,或者动态减少服务实例节约服务器资源.下面我们将动态增加redis-sl

客户端主动运维:查看磁盘监控状况

使用everest工具,查看PC硬盘情况.如下图: Reallocated Sector Count告警提示你硬盘出现坏道.无法修复.正在使用备用扇区.如果坏道过多,将会丢失数据. 作为运维人员,这个可以作为日常工作的一部分.属于主动运维,降低数据丢失的机会. 客户端主动运维:查看磁盘监控状况

运维:CentOS6.5 升级到 PHP7 Alpha2

关闭现在的PHP:killall php-fpm 删掉现有PHP:rm /usr/local/php -rf 下载 PHP 7 Alpha2:wget http://openlogic.oss-cn-hangzhou-internal.aliyuncs.com/php-7.0.0alpha2.tar.gz 编译方法:看我上篇博文这里我新加了一个参数: --with-freetype-dir,另外去掉了 --with-mysql,为什么要这么做呢?因为我需要freetype,并且,PHP7不再把m

Linux监控和安全运维 2.0 zabbix配置邮件告警

1.发邮件启动postfix /etc/init.d/postfix start mail -s "test" 836503270@qq.com < /etc/inittab mailq 查看发送结果 2.配置发邮件文件 mkdir -p /home/zabbix/bin vim /home/zabbix/bin/baojing.sh #! /bin/bash echo "$3" |/bin/mail -s "$2" $1 chmod +x

从On-Premise本地到On-Cloud云上运维的演进

摘要: 从用户的声音中,我们听到用户对稳定.弹性.透明的诉求,我们也在不断升级ECS的运维能力和体验,助力用户建立主动运维体系,赋能业务永续运行.为了让大家更好的了解和用好ECS弹性计算服务,从本期开始,我们会以专栏的形式不断更新ECS运维方面的内容,也欢迎大家多提宝贵建议和意见,帮助我们打造更好的弹性计算服务. 阿里云经过9年多的发展,成长为中国第一全球前三的云服务提供商,为上百万用户提供IT基础设施云服务.这些用户几乎都会使用ECS弹性计算服务,这其中既有面向消费者(to C).企业(to

网络流量分析——NPMD关注IT运维、识别宕机和运行不佳进行性能优化。智能化分析是关键-主动发现业务运行异常。

科来 做流量分析,同时也做了一些安全分析(偏APT)--参考其官网:http://www.colasoft.com.cn/cases-and-application/network-security-analysis.php 作为安全工程师的你,想发现有谁在攻击我,还原攻击过程并且取证么? 作为立志成为网络技术大拿的你,想在学习理论知识的同时,了解实战中会遇到的哪些问题,这些问题用什么样的思路去解决么?如果以上答案为Yes,那么<CSNA网络分析经典实战案例>就是你的菜,以下内容全是网络安全真

让您的运维更可预期(二) - ECS系统事件支持历史事件查询

摘要: 主动运维又填新功能,全部事件页登场,您可以查看您的实例以及磁盘所发生的历史系统事件,有助于您对资源有个更全面清晰的掌控. 背景 数月前,我们推出了新的功能:让您的运维更可预期(一) - ECS系统事件支持用户自助重启和预约操作 .有了这个功能,当您的云服务器所在的物理机硬件可能存在安全风险需要迁移的时候,您可以自己去决定解决问题的时间,让您感受到的是掌控情况的踏实.而今,这个功能增强啦,让您对您的实例资源健康状态有了更全面的了解. 主动运维全部事件 您可能已经注意到,在ECS控制台事件页

阿里巴巴大规模神龙裸金属 Kubernetes 集群运维实践

作者 | 姚捷(喽哥)阿里云容器平台集群管理高级技术专家 本文节选自<不一样的 双11 技术:阿里巴巴经济体云原生实践>一书,点击即可完成下载. 导读:值得阿里巴巴技术人骄傲的是 2019 年阿里巴巴 双11?核心系统 100% 以云原生的方式上云,完美支撑了?54.4w 峰值流量以及?2684 亿的成交量.背后承载海量交易的计算力就是来源于容器技术与神龙裸金属的完美融合. 集团上云机器资源形态 阿里巴巴 双11 采用三地五单元架构,除 2 个混部单元外,其他 3 个均是云单元.神龙机型经过