阿里技术保障 莱澳 技术运维IDC 专家
1 前言
近几年,数据中心发展如火如荼。伴随云计算、大数据、物联网等从概念到实践,作为支撑这些业务发展的数据中心基础设施行业面临巨大的机遇和挑战。国内数据中心以投产机架或投资计算,近2~3年基本保持20%以上增速,尤其是国家政策引导数据中心向富裕能源和气温适合区域发展,超大型数据中心(1000个机架以上)如雨后春笋,发展迅速。以国内三大运营商的内蒙/贵州等园区为例,均规划有上万个机架,单体规模均刷新全国乃至亚洲最大数据中心园区。同时我们也看到,国内数据中心从整体设计,能效、施工、运维,乃至标准等整体水平相比国外仍然差距较大。当然国内也出现了互联网、运营商等公司推动的模块化IDC概念,近3年在国内变得炙手可热,也衍生了各种模块概念。到底什么是模块化,目前为止业界依然没有一个广泛认可的解释。有趣的是,从传统数据中心对比说明模块化的优点时,传统数据中心的定义也模糊不清。据笔者的调查研究以及国外同行交流,很多欧美的“传统数据中心”设计,实际TCO和PUE也非常出色,有好些甚至超过国内某些“微模块”概念数据中心。这些所谓“传统”数据中心设计通常包括高频UPS/飞轮UPS、高架地板下送风、精密空调和冷冻水系统,在同等气候条件下,年平均PUE可以做到1.25以下,那是否TCO和PUE甚至某个电力系统是区分传统与模块的标志,抑或关键点呢?
笔者从很多疑惑开始,在验证和实施数据中心模块化的道路上,从最佳实践着手,探寻数据中心发展的路在何方?在理论体系方面,施耐德APC发布的第160号白皮书,系统解释了模块化的概念以及一些应用,当时给笔者很大启发;后续通过在工作中,梳理了一套从业务、IT服务器机架,IT模块化,网络、机电模块化,乃至数据中心和园区的模块化体系之后,整理思路,和业界人士沟通交流之后,笔者决定重写一稿模块化的文章,并引申出标准化进程实践理念和方法论,向施耐德APC白皮书的创始人Neil Rasmussen致敬。施耐德APC的第160号白皮书链接如下::
http://www.apcmedia.com/salestools/NRAN-7ZE9R3/NRAN-7ZE9R3_R1_CH.pdf?sdirect=true
本文篇幅较长,尽量做到通俗易懂,满足不同水平受众,水平有限,如有谬误,请联系笔者。
个人声明:本文引用图片为网络公开材料的图片或笔者自行创作图,尽量从个人专业角度解释一些人们本该了解并一直没弄清楚技术本质,不代表本人所在公司的任何观点和看法;论述针对技术和科学本身,不针对任何公司的技术或产品;更多是提出问题并给出思考推导过程,希望读者一同思考以下问题:
1)模块化的概念如何定义?怎样判断是否模块化?
2)产业链什么利益者推动着模块化数据中心前进?背后的驱动力?市面上宣传各种模块化优势,例
如快速部署和降低PUE是否真实,用户应该怎么判别和选择?
3)国内市场微模块成为关注点,到底怎么回事?用户是否必须部署?
4)有各种的模块化方案可以实施,用户应该先做哪个,找谁做,怎么做?
2 模块化数据中心核心要素定义
查模块化词条定义:模块化是指解决一个复杂系统时自顶向下逐层把系统划分成若干模块的过程,有多种属性,包括接口、功能、逻辑、状态,功能、状态与接口反映模块的外部特性,逻辑反映它的内部特性。在系统的结构中,模块是可组合、分解和更换的单元,具有更好的可管理性。
为了简单解释数据中心模块化,就是把模块化的关键属性拿出来,在此笔者称为模块化核心要素。笔者先给出两个例子作对比。
例子一:
图1:左图为APC的英飞系统,右图为Facebook的IDC设计(均来自网络公开图片);
简要解读上图内容: APC英飞系统有一套模块化UPS(N+1)设计,一台输入输出柜和电池柜、列间空调,机架顶部上走线,空机架;而Facebook设计为一套48V直流电源+电池,6个定制含电源模块的空机架,上走线;大家发现,如此不同的两个方案都是模块化,我们看看两者区别。
区别 |
描述 |
系统设计 |
APC设计为N+1,Facebook为N+1的48V直流电源; APC为列间空调,Facebook无近端制冷单元; APC为空机架,先定义机电,适配通用服务器,Facebook含电源和服务器的机架,先定义IT单元,机电单元匹配服务器模型 |
设备容量 |
APC模块化UPS的容量为160kVA,Facebook为约60kW; |
组合方式 |
Facebook没空调,集成末端紧密配电而没有配电柜 |
平面布局 |
APC两排机架、Facebook一排机架 |
再来看看另外一个例子:
图2 HP的EcoPod
图3 IO Anywhere的IT模块
同样,两者的区别:
区别 |
描述 |
系统设计 |
HP设计为不集成UPS;IO为不集成UPS的IT模块, HP的制冷设备设计在顶部,而IO设计为下方; |
设备容量 |
HP设计为每个机架20kW,而IO为10~30kW; |
组合方式 |
HP设计多个拼装,含整套制冷系统;IO为冷冻水空调末端; |
平面布局 |
HP为两排机架+完整制冷系统、IO为一排机架+空调末端 |
通过上面例子可以发现,对模块化的不同点归类后,我们就得到模块化属性类别, 和4个核心要素,分别是:
接口、功能、逻辑、状态;
1) 功能对应系统设计;
2) 逻辑对应关联业务的设备容量;
3) 接口对应组合方式;
4) 状态对应物理平面布局;
因此,模块化数据中心,就是在传统数据中心的基础上,对复杂的系统做进一步的子系统模块分解重构(组合方式),对系统容量进行与业务关联的定义,并按照对应的接口和外在物理形态进行组合,以实现简单可复制,规模交付,更好的运营管理。
3 模块化市场参与者推动者
首先必须承认一点,笔者认为模块化是数据中心的潮流和方向,是数据中心的一种系统解决方案方法论。模块化概念之所以受到业界接受,是最终用户通过模块化解决方案解决了问题,获得收益;卖方市场,宣传包装模块化方案价值,提高销售获取利润。在施耐德APC的第160号白皮书开篇也阐述了很多模块化解决传统数据中心的问题,摘录如下:
问题 |
模块化如何应对这类问题 |
投资成本利用率低下 |
模块化方法能实现基础设施按需部署,而不是在前期一次性部署。 |
设计和安装周期时间长 |
模块化数据中心采用预设计和预生产的系统,缩短了设计和安装时间。 |
质量 |
采用预设计和预生产的设计,能够减少缺陷。 |
功率密度设计错误 |
采用模块化设计,可在部署时再进行功率密度等决策,而不必提前数年就作出此类决策。 |
管理系统的编译和配置非常复杂 |
模块化设计使用标准化管理工具,具有更多开箱即用的特性,减少每次项目都进行编程。 |
容错性 |
模块化设计一般包括添加 N+1 冗余,支持容错和并行维护的能力。 |
符合标准要求 |
模块化设计可预先验证,遵从安全、能效、兼容性、安防 等标准,无需逐个评估,避免出现不符合标准的意外情况。 |
简化运营人员培训 |
标准化的数据中心设计方案可以简化培训。 |
能效 |
造成数据中心效率低下的首要原因就是容量设计过大。可扩展模块化数据中心设计通过按需规划容量,避免了这个问题。其它许多导致效率低的问题也可以通过采用预设计和标准化的方式得以解决。 |
在此笔者不想论述模块化解决哪些问题,白皮书已经有较多阐述。笔者提出一个不同的思考角度,不是从最终用户,而是从市场角度看,哪些人推动着模块化?答案很简单,每个数据中心项目,涉及设计、产品、解决方案三部分,分别对应咨询设计院、设备制造商、集成解决方案供应商。
下面简要列举几个卖方对模块化的典型宣传说辞:
咨询设计院:设计从一个数据中心园区由几栋数据中心大楼、分期部署、每个数据中心设计也标准一样
成模块,每一层有多个主机房,每个主机房有多个通道密闭微模块等等。
设备制造商:设备模块化设计,例如模块化UPS,有监控模块,功率模块,输入输出模块等等。
集成解决方案供应商:解决方案有多个设备,可以灵活满足Tier1~Tier4设计,例如目前国内市场热门高
频词微模块,一个模块里面含有空调、配电、电源、电池、机架、布线、通道密闭等。
市场宣传术语和方法看似大同小异,但很明显,咨询设计院、设备供应商、集成解决方案供应商各自表述的模块化取决于自身能提供的产品和方案。简而言之,咨询设计院关注设计理念,因为他们的交付物是中大型数据中心设计图;设备制造商关注设备直接带来的功能;集成解决方案供应商关注不同设备打包销售+工程能力,他们交付物是一揽子产品+工程+部分深化设计能力。
(未完待续)