弹性计算平台技术:云服务器“安全”“稳定”“弹性”的基石

摘要: 2018杭州云栖大会,弹性计算平台技术专场精彩回顾

9月19日上午9点,杭州云栖小镇E1-3会场,2018年杭州云栖大会弹性计算平台技术专场拉开帷幕。

弹性计算系列产品是云时代的基石产品之一,一直备受外界关注。作为弹性计算团队在本届云栖大会的开场大戏,平台技术专场吸引了超过200位与会嘉宾,现场座无虚席。为了让更多的朋友快速了解这场技术盛宴,小编现在带你快速回顾一下专场的精彩片段。

全场景覆盖,面向未来的弹性计算

首先,阿里云研究员,弹性计算负责人余锋,做了精彩的开场演讲。余锋说,阿里云弹性计算团队的服务能力正在从中小企业客户到大型企业全计算场景覆盖的方向演进,不但覆盖通用CPU场景,也有GPU,FPGA等等异构场景,另外弹性计算团队也在存储,网络等方面不断扩展能力边界。

此外,团队正在持续打磨产品的稳定性和服务质量,在企业生态配接上做出努力。弹性计算团队正在通过强化对于硬件服务器的管控能力,对操作系统的定制能力,和对故障隔离能力等等多个维度提升客户对稳定性的体验,宕机率大大降低,在业界遥遥领先。

另外,弹性计算团队也正在通过弹性容器实例,为用户提供更轻,更快,秒级计费,同时兼顾安全和生态的全新服务,为更多的客户量身打造更高性价比,更合适的计算服务。

深入合作,一起探讨云计算的未来

来自英特尔开源技术中心的网络与存储研发经理王庆先生首先带来议题:关于当代云计算的方向展望。将云计算和通信,人工智能,边缘计算等等热点领域的关系进行了深入梳理,并挖掘了相关的技术方向。

明星产品,重磅发布

随后,阿里云高级产品专家倪波,代表弹性计算团队带来了最新的产品更新。在块存储产品领域,倪波宣布IOPS达到百万级的全新一代超高性能云盘ESSD即将全面商业化。

同时,作为新一代异构计算的代表产品,最新的GN6V和F3实例正在全面商业化推进中。GN6V实例搭载NVIDIA Volta架构的Tesla V100计算卡,相对于上一代产品可以提供12倍的运算能力提升。而基于阿里云FaaS(FPGA as a service)舜天平台的F3实例对比上一代产品,逻辑容量增加4倍,DSP能力提升8倍。

议题还介绍了无限制T5实例,该实例可以在传统T5实例积分耗完后,让用户能够继续按需使用付费,从而保持计算性能的持续性。

该议题的最后,弹性计算团队重磅发布了弹性容器实例ECI (Elastic Container Instance)。ECI作为弹性计算在Severless领域的创新产品,具备以下四大特点:极速交付,极小资源,全面兼容K8S,用户只需专注业务。

保持和学术界的无缝对接

弹性计算团队一直和学术界保持无缝对接,对于新技术,新理论一直高度关注。论坛也邀请了华南理工大学的林伟伟教授,详细分享了“面向异构云服务器的能耗模型和能耗测算系统研究”的议题。

该技术在应用后,可以作为云服务器的功耗测算工具,为新服务器功耗模型提供评测功能,也可以为服务器能耗优化调度提供技术支撑和基础平台。同时,基于功耗模型可以给出峰值能效感知的虚拟机调度策略,并以此作为调度的参考信息之一,可以实现对云数据中心更为有效的节能调度。

云服务器测试怎么做到有意义?

阿里云高级技术专家钱超,分享了“怎样有意义地测试云服务器性能”。

钱超从多个角度和指标来阐述了性能测试。钱超指出性能,稳定,时延是互相影响的,脱离另两个只讲其一是不全面的。同时在测试时,需要结合客观条件来对比结果(比如CPU是否PIN住,操作系统的影响等等)。议题客观,实用,现场观众反应热烈。

弹性计算的极致稳定

接着性能测试的议题,阿里云高级技术专家郑旭东分享了关于产品稳定性的议题:“数据,智能,驱动ECS极致稳定”。议题从智能异常调度,健康巡检,强大的分析和预测系统等角度,全面立体地呈现了弹性计算团队在达到极致稳定性上所做的努力。

弹性计算团队借助阿里巴巴强大的基础设施,重构建立了覆盖全生命周期,全链路,全类型的4大类,11小类,同时具有上千项监控细节的监控系统,每天光监控数据都有几十TB。另外,利用人工智能技术做出精准预测,帮助快速发现业务异常和系统隐患。弹性计算正在利用数据,智能,异常调度,客户侧运维形成强大的闭环,随着闭环上数据的积累,可以真正将稳定性做到极致。

首次揭秘:弹性计算调度系统 - 后羿

随后,弹性计算首席架构师,阿里云资深技术专家蔡俊杰,和阿里云高级技术专家徐海弘共同为来宾解密了弹性计算的幕后英雄 – 后羿调度系统。

议题指出,弹性计算调度系统正在从稳定性,性能,成本,和弹性四个方面影响产品。弹性计算调度系统需要管理全球50多个区域的资源,单可用区可以在3分钟内创建一千个以上的虚拟机,每天需要管理的虚拟机数量是在百万级别的。另外,调度系统不仅仅是虚拟机的调度,甚至还包括服务器的采购,机房规划,资源的使用分配都会被纳入闭环,端到端地实现产业优化。

议题还揭秘了弹性计算调度系统的三大层次,和四大核心组件,并且从场景角度切入进行了详细立体的剖析。

主动运维:赋能业务永续

阿里云高级产品专家张鹏程带来了关于主动运维的议题。

议题强调,基于ECS主动运维能力,用户从高可用架构设计开始,将主动运维的思想贯穿于各个基础运维环节。借助云助手、弹性伸缩、系统事件等服务和功能实现开放、弹性、透明体验,建立适合自身业务规模和技术路线的主动运维体系,赋能业务永续运行。

资源编排,弹性伸缩,带来高可用和低成本

最后,阿里云资深技术专家田涛涛带来议题:基于资源编排和弹性伸缩构建高可用低成本的应用。


田涛涛详细介绍了资源编排的使用场景。使用资源编排,实现自动化复制和交付,可以让基础设施更加高可用。结合弹性伸缩,自动保障业务的永续性和可靠性。另外结合抢占式实例和停机不收费模式,切实实现成本和弹性需求的完美结合。

阿里云弹性计算团队,让计算无处不在。

原文链接

本文为云栖社区原创内容,未经允许不得转载。

原文地址:http://blog.51cto.com/13952056/2298829

时间: 2024-10-08 13:56:16

弹性计算平台技术:云服务器“安全”“稳定”“弹性”的基石的相关文章

阿里云云中沙箱自助实验-使用OpenApi弹性释放和设置云服务器ECS释放

云服务器ECS的一个重要特性就是按需创建资源.您可以在业务高峰期按需弹性的自定义规则进行资源创建,在完成业务计算的时候释放资源.本篇将提供几个Tips帮助您更加容易和自动化的完成云服务器的释放和弹性设置. 本文将涉及到几个重要的功能和相关API: 释放按量付费的云服务器 设置按量付费实例的自动释放时间 停止服务器 查询实例列表 释放后实例所使用的物理资源都被回收,包括磁盘及快照,相关数据全部丢失且永久不可恢复.如果您还想继续使用相关的手,建议您释放云服务器之前一定要对磁盘数据做快照,这样您可以下

如何在腾讯开放平台的云服务器上安装php和memcache 一

由于被通知腾讯的CEE要关闭了,必须自己切换到服务器,自己装php.烦到一个B. 首先找到官方wiki: http://wiki.qcloud.com/wiki/SUSE%E7%8E%AF%E5%A2%83%E4%B8%8B%E9%80%9A%E8%BF%87YaST%E5%AE%89%E8%A3%85%E8%BD%AF%E4%BB%B6 基本上就是 zypper in niginx zypper in php5-mysql php5 php5-fpm 然后配置 http://wiki.qclo

弹性云服务器如何帮助企业优化成本

企业上云正成为中小企业的重要财务救星,它们希望花更少的资金和精力享受更高的计算速度和效率.因此,越来越多的企业将他们的业务迁移到到云,以提高可访问性.可用性和可伸缩性.那么,云服务器是如何帮助企业实现成本优化的呢?主要通过以下五个方面帮助企业缓解IT管理压力,降低业务运维成本.更灵活的资源管理由于云服务器资源具备弹性调度.伸缩的能力,因此您可以通过长期采购与根据短期需求变化调整资源配额的方式,实现资源的合理搭配,降低资源闲置造成浪费的风险.另外,云服务器支持灵活的资源挂载和再分配,您可以单独订购

云服务器

发展历史 编辑 云服务器的业内名称其实叫做计算单元.所谓计算单元,就是说这个服务器只能算是一个人的大脑,相当于普通电脑的CPU,里面的资源都是有限的.你要获得更好的性能,解决办法一是升级云服务器,二是将其它耗费计算单元资源的软件部署在对应的云服务上.例如数据库有专门的云数据库服务.静态网页和图片有专门的文件存储服务. 而且云服务器不是说就便宜了,相反会比一般的VPS都贵.为什么?因为它相对于来说,扩展比较方便.云服务器是网站做大了.有很高收入的时候一个不错的选择. 云服务器是云计算服务的重要组成

阿里云一 第一篇:云服务器ECS

阿里云(www.aliyun.com)创立于2009年,是全球领先的云计算及人工智能科技公司,为200多个国家和地区的企业.开发者和政府机构提供服务.截至2017年3月,阿里云付费云计算用户达87.4万.阿里云致力于以在线公共服务的方式,提供安全.可靠的计算和数据处理能力,让计算和人工智能成为普惠科技. 但是对于很多刚刚接触阿里云的用户来说,经常会被这庞大的产品系统.众多的服务弄得眼花缭乱,感觉无法下手,不知道该怎么选择适合自己的产品服务.针对这个问题,从今天起,我会带着大家一起,分门别类的对阿

《云服务器》与《传统服务器》的区别

云服务器介绍 VPS是一种服务器的虚拟化技术,是采用虚拟软件KVM/xenserver/vmware等在单台服务器上虚拟出多个类似独立服务器的部分,每个部分都可以做单独的操作系统,管理方法同服务器一样.存在单点故障,扩容复杂. 而云服务器是在一组集群服务器上虚拟出多个类似独立服务器的部分,集群中每个服务器上都有云服务器的一个镜像,从而大大提高了虚拟服务器的安全稳定性,除非所有的集群内服务器全部出现问题,云服务器才会无法访问.(如下图) 传统服务器介绍 传统的服务器是具有独立的CPU.内存条.硬盘

阿里云异构计算发布:轻量级GPU云服务器实例VGN5i

阿里云发布了国内首个公共云上的轻量级GPU异构计算产品--VGN5i实例,该实例打破了传统直通模式的局限,可以提供比单颗物理GPU更细粒度的服务,从而让客户以更低成本.更高弹性开展业务.适用于云游戏.VR/AR.AI推理和DL教学等轻量级GPU计算场景,更细粒度的GPU计算服务. 轻量级GPU云服务器是什么? 轻量级GPU云服务器是一种新的GPU云服务器规格族,是通过公共云的GPU虚拟化技术将分片虚拟化后的GPU资源以虚拟GPU的形式安装在GPU云服务器实例中.与常规GPU云服务器的区别在轻量级

腾讯云服务器初体验

腾讯云平台选购云服务器,我选购了suse10 64bit的系统,付款后大约2分钟提示已经分配完毕,根据IP和用户名密码登陆服务器. 第一步:初始用户是root,需要自己创建用户组和用户. groupadd -g 1000 zd useradd -g zd -s /bin/csh -d /home/zd -m -p z zd 详解一下命令 groupadd -g gid 指定用户组id,组id最小为501,0-999是系统保留组id,用户设id最好是从1000开始 -r 创建一个系统账户 -o 允

关于阿里云服务器能满足多少人同时在线的计算方法

关于阿里云服务器最多能支持多少人同时在线这个问题,其实是很难的出一个精确答案的.因为结果会受到带宽.服务器处理速度.不同用户正在访问的页面大小等一系列因素的限制,而这些都是我们在建站时都很难具体确定的. 既然上面也说了,精确的回答一个服务器能支持多少人访问这个问题几乎是不可能的,既然人们喜欢问最多,那我就算算服务器的极限吧. 接下来将要进行的计算基于如下假设: 假定你的阿里云服务器带宽为1M.(如果你的带宽是N兆的话,计算结果乘N就好了)假定用户等待网页响应的最长时间为8S.(八秒定律:在互联网