阿里云E-HPC赋能制造业仿真云弹性

摘要: 从公测开始说起 去年9月份E-HPC开始公测,某仿真客户便开始申请使用弹性高性能服务。该客户因为业务关系已开始或多或少使用云计算产品,另一方面传统制造业发展问题也促使客户想尝试做出一些改变。 经过同客户的初步交流,客户的主要痛点集中在以下方面:客户从事仿真行业,通过服务传统的制造业获得营收,因此客户的客户集中在汽车,航天,船舶等。

从公测开始说起

去年9月份E-HPC开始公测,某仿真客户便开始申请使用弹性高性能服务。该客户因为业务关系已开始或多或少使用云计算产品,另一方面传统制造业发展问题也促使客户想尝试做出一些改变。

经过同客户的初步交流,客户的主要痛点集中在以下方面:客户从事仿真行业,通过服务传统的制造业获得营收,因此客户的客户集中在汽车,航天,船舶等。一方面该仿真企业的客户在不同阶段对算力的需求也不尽相同,有时也突然遇到比较大的仿真需求的客户,自己机房的小规模的机器经常满足不了生产需要,总的来说一年四季客户对计算力的需求总是会有各种各样的波动。

最开始的弹性

E-HPC刚上线时为在云上资源所建立的集群提供了计算机群扩容和缩容的功能,这意味者在云上New出来的计算节点一方面要能部署同其他计算节点一样高性能软件栈,另外一方面要求节点要有同一套POSIX账号体系,以便集群作业调度器能够将用户提交的作业调度到该节点上运行。客户刚开始便很快完成了基于ECS的集群创建,刚开始运行需要几十个计算核心的算例,通过E-HPC的扩容完成计算机群节点的增加,同时可以马上在该集群运行更多核心的结构和流体求解器计算作业。

能自动伸缩的弹性

客户为制造企业提供仿真服务,有些算例客户在运行前可以预估大概需要多少计算核心计算多少时间,但有些复杂算例,客户也无法确定资源需求量。客户希望E-HPC产品提供的计算机群能够贴着客户从仿真系统提交的作业数量和实际的真正运行作业的计算核心数走,即客户想尽可能用好每一个CPU周期,因此希望E-HPC能帮助客户自动完成自动增加计算节点和自动减少集群的计算节点。所以,AutoScale功能便上线了。AutoScale可以根据整个高性能集群的负载和策略动态调整计算机群扩容和缩容。

同云桌面/GPU服务器的结合

一般在仿真工作流里面,完成大量的仿真计算后会进入到渲染阶段,所以一般会经过GPU服务器集群的Pipeline,最后通过云桌面展示给客户的客户。于是E-HPC开始支持自定义镜像,方便客户从带有特点渲染软件的镜像启动GPU实例完成仿真后处理工作,并且E-HPC开始推出支持竞价实例的扩容方式以便客户能够使用较低的成本完成一些无状态的训练任务。

超级计算集群

传统的高能计算,为了计算的极致,从每年的Top500来看,在计算存储网络方面都有很明显的特点。首先,在计算方面高能计算的集群的计算节点倾向于选择高主频类型的处理器,频率基本都在3GHz~4GH;其次在存储方面 基本是基于传统企业级盘阵,存储系统的可靠性放在盘阵自身的容错能力上,很少使用多副本的方案;在网络方面,传统应用多使用基于同步通信的并行算法,因此为了能达到较大的加速比一般使用低延迟的RDMA网络甚至是专门定制的通信网络。

年初云上超级计算集群(SCC)开始公测,提供能运行超算应用的计算存储和网络基础设施,SCC能够给流体仿真之类的有限元分析软件提供近乎线性的加速比。结合E-HPC提供的弹性,客户很快便完成了POC测试。

我们可以看到对于同样几亿单元的有限元分析,使用SCC无论是单节点的计算能力还是多节点加速比都有显著提升,因此客户给反馈了如下的测试感受:

“1.计算性能强劲:无论是单节点的计算能力,还是多节点分布式计算能力都有显著提升,在测试项目计算规模之内,都可以获得非常不错的加速效率”

“2.集群互联IO性能:RDMA高速互联可以满足一定范围内的大规模的机械,流体等仿真应用计算要求,效果显著” ,要性能有性能,要弹性有弹性之后,客户便更有信心将仿真生产系统往云上迁移。

仿真应用迁云

该仿真客户经过多年的仿真服务实践,开发了一款仿真系统,该系统集成了制造仿真行业常用的商业软件,基本覆盖碰撞仿真,流体动力学,机械结构,电磁模拟等。

该仿真系统提供了统一的Portal给不同的制造企业以一致的体验完成仿真工作流,早期的系统结构基本如下图所示:从中我们可以看出早期的结构基本立足于传统超算,融合了CAE并行计算、计算资源调度、软硬件资源管理、远程图形桌面以及CAE专业应用等技术,由此面向仿真用户提供仿真计算服务。客户需要很重的成本来拥有这些基础设置作为生产资料来服务客户的客户。然而,经过交流,客户的心声是做仿真他们是专业的,但是经营IT基础设施只是为了维持他们的仿真生产系统而进行的活动;他们想专注于仿真服务,而将IT基础设施迁往云上,于是客户便有了仿真系统迁云的想法。

客户想通过将仿真系统迁云,达到以下效果:

1.用户不需要购买任何物理IT硬件资源,通过Web即可开展仿真分析工作。

2.统一管理和调配专业软件软件管理,充分利用昂贵的CAE软件资源。

3.通过云计算弹性充分利用云上资源进行仿真。

经过逐渐的验证,客户在阿里云上完成了将仿真流程收敛到下面的结构:

从上面的分析,我们可以发现客户能够更加专注于仿真工作流本身,而将对IT基础设施的使用变成了阿里云上一条一条的OpenAPI;需要集群时通过一条OpenAPI New出一个超算集群,算力不够时通过一条Open API New出新的计算机群,作业空闲时通过一条Open API释放计算机群,不想手动操作时通过一条Open API 自动伸缩集群。客户不用再考虑自建机房,备货,扩建,设备运维...... 。

总结

随着工业仿真技术的不断发展和成熟以及工业产品的自身的复杂程度越来越高,目前现在多数工业仿真对象都是在各种复杂物理环境条件情况下进行的,这种情况决定了完成工业级的仿真工作需要大量的计算和高性能的存储资源,以及配套的可以执行快创建和访问仿真模型和数据,并能够实现较高程度的自动化仿真流程。工业上的仿真技术在产品研发中所扮演的角色在流程上越来越靠前,不再是产品设计完成后的后端验证。与此同时,工业仿真技术在产品生命周期的下游也发挥着越来越重要的作用,比如分析来自工业物联网中机器的实时操作数据。因此,工业仿真所需计算资源、人才培养、环境建设的难度都在增加。但对于企业来讲,搭建一个环境并培养专职的仿真工程师并不容易,仅仅是购买软硬件的需求调研就可能花费数月时间,之后还得投入大量的时间和精力进行专业领域仿真培训和应用部署。

同其他的企业级IT应用一样,云计算技术正在给仿真应用带来巨大的改变。通过仿真云平台能够对产品进行设计、改进、创新进行模型的快速验证和方案的对比。对于传统制造企业来说,使用云计算技术的价值归根结底是不用购买和管理物理计算集群,从而可以改变传统的仿真应用流程,更加专注于仿真应用本身。基于云计算技术,企业将可以用到更加灵活的软件使用价格,并可以随时随地进行建模解决复杂的仿真应用问题。借助同时模拟多个不同设计方案的能力,基于云计算技术的仿真可以支持传统制造业更轻松地进行产品设计和工程仿真。通过在阿里云上仿真,可以很快获取弹性资源,能够在很短的时间就可以进行完整的仿真生产流程。不管是加快产品创新,还是满足制造业不断增长的仿真需求或是,加强全球合作提高IT投资回报率,都会收到立竿见影的效果。

原文链接

原文地址:http://blog.51cto.com/13679539/2118070

时间: 2024-10-30 16:33:21

阿里云E-HPC赋能制造业仿真云弹性的相关文章

阿里云镜像市场,让“上云”从此零门槛!

  您还在为复杂的云服务器环境配置所困扰? 阿里云镜像市场,让“上云”从此零门槛! 镜像市场是什么? 阿里云镜像市场:为云服务器ECS用户,提供通过严格官方审核的第三方镜像及相关服务.这些镜像在操作系统上整合了具体的软件环境和功能,如PHP/.NET/JAVA/NODE多语言运行环境.控制面板.建站系统等,供有相应需求的用户开通云服务器时选用. 镜像能为您带来什么? 通过镜像来创建云服务器实例,只需几个点击,您可快速获得与镜像一致的系统环境或软件.从此无需费心基础结构及环境配置,即可更便捷地为每

【阿里云产品评测】装甲兵在云路上!

小编:高考结束,假期犹长!学生党:装甲兵,已经趁着假期开始踏入地方门户网站的建设这条路!这条评测从选购.备案.安全.综合四个方面给出了评测报告.“不得不点2014个赞!” 阿里云用户:论坛昵称装甲兵 一.导读 高考结束,假期犹长!家乡互联网程度并不高,本地门户网站还未真正的发展起来,所以趁着假期开始踏入地方门户网站的建设这条路!         网站建设,要经过很多步骤流程:            a.选择网站名.合适的域名:            b.选择一个适合发展的网站程序:       

云技术平台赋能媒体融合发展创新

欢迎大家前往腾讯云技术社区,获取更多腾讯海量技术实践干货哦~ 作者:熊普江 媒体行业是传统而又新兴的行业,在数字化.信息化.移动化快速演进的今天,无论是用户.社会还是行业.政府都意识到,传统媒体与新兴媒体融合发展是必然之路.但媒体融合需要内容和技术双驱动,内容是硬道理,技术是生产力.融合并不是简单的内容复制和粘贴,需要有一个促使融合从梦想到现实的因子,这个因子就是技术. 2016年人民日报媒体技术股份有限公司联合腾讯云共同发布了我国首个媒体融合云服务平台------中国媒体融合云,意在为媒体融合

阿里云1核 2G 40G 高效云盘的云服务器低99一年,活动还剩最后几天,附活动邀请链接

阿里云1核 2G 40G 高效云盘的云服务器低99一年,活动还剩最后几天 云服务器 ECS最新版 1 核 2 G 1 M带宽 40 G 高效云盘 新用户专享| 限1台 | 最低¥8.25/月 ¥99/年 最多省¥1125 ¥198/2年 最多省¥2250 ¥297/3年 最多省¥3375 活动链接为: https://promotion.aliyun.com/ntms/act/group/team.html?group=lWCcBOsP3g 原文地址:https://www.cnblogs.co

腾讯云服务器怎么样?腾讯云服务器详细测评

腾讯云服务器,简称 CVM 是通过高性能服务器虚拟化的云服务器.拥有专业团队打造资源隔离.数据安全.密码安全.安全加固等多达 20 种安全防护手段.其实就是和阿里云(ECS)差不多但技术不同的 VPS.以下我就用腾讯最低配带公网 IP 的这一套餐来评测一下吧(¥65/月)! 一.购买云服务器: 购买地址 ,下单后 2~3 分钟生成: 已经迫不及待了有木有呢?!接下来是小评测,跑分什么的. 二.硬盘读写.下载速度.跑分: 为了给大家一个全面的选择,准备了一些小数据给大家看.首先 CPU 使用的 E

为云服务立规矩——首批可信云服务认证名单公布

俗话说,没有规矩不成方圆.在云服务蓬勃发展的今天,无论从规范行业发展,还是为用户提供保障,推动政府云服务采购的角度来说,云服务市场都需要立规矩. 7月15日至16日,以"可信中国云,未来新生态"为主题的2014可信云服务大会在北京召开.大会公布了首批通过可信云服务认证的云服务名单.此举不仅为用户未来选择云服务提供切实可信的依据,而且也为建立可信的云计算生态系统打下了基础.本次会议由工业和信息化部指导,工业和信息化部电信研究院.中国通信标准化协会主办,数据中心联盟和云计算发展与政策论坛承

混合云存储跨云灾备方案之跨云复制

摘要: 混合云容灾实现了跨云/多云场景中的应用和整机的灾备和恢复.支持整机和主流的企业应用,如各版本的Oracle(Oracle RAC近期即将支持)和SQL Server等.先进的压缩重删服务节约了备份时的网络带宽和空间占用,云灾备库的按需分配和弹性无限扩展,灾备ECS可关机不付费等多个特性,从多个维度将用户成本降到最低. 前面两篇文章介绍了基于阿里云备份的跨云备份和云存储网关的跨云复制,两者主要是解决文件粒度的备份与恢复问题.如果用户需要保护一个云上的数据库应用,而不仅仅是数据库的数据文件:

混合云存储跨云灾备方案之跨云备份

摘要: 阿里云混合云存储团队的云存储网关,混合云备份和混合云容灾产品能够给用户提供完备的容灾方案,从而解决客户本地IDC到阿里云的混合云灾备场景和其他云厂商平台到阿里云的跨云灾备/多云灾备场景所遇到的问题.通过两次备份和一次恢复来演示混合云备份是如何备份用户云主机上的文件,备份增量数据和恢复用户数据的. 公有云市场现状,问题及趋势 从全球公有云市场来看,亚马逊AWS一枝独秀,占据了接近40%的市场份额.2017年全年,AWS营收为43.3亿美元,销售额为174.6亿美元.而在中国公有云市场,阿里

“精钢云”落地:鞍钢携手金山云推动中国制造

世界500强企业辽宁鞍山钢铁集团(以下简称"鞍钢")与中国云计算领军企业金山云正在携手共同培育钢铁行业的新动力. 近日,金山云和鞍钢共建的工业云平台--"精钢云"正式落地.这一平台运用"云+大数据+人工智能"技术,让企业降低生产成本,大幅度提高生产率.通过加强信息化建设,建设数字化工厂,实现智慧诊断.智慧物流.智慧质量.智慧安全,重构商业模式.利用"精钢云"平台,鞍钢将在智能制造上更进一步,实现由制造型企业向服务型企业的转变,