前言
2014年,全球IDC市场增长速度略有上升,整体市场规模达到327.9亿美元,增速为15.3%。其增长速度的主要拉动力来自于亚太,IT企业、互联网企业和电信企业在数据中心方面的投资加大推动了整体市场的发展。2014年中国IDC市场增长迅速,市场规模达到372.2亿元人民币,增速达41.8%,互联网市场的刚性需求拉动IDC快速增长。在过去六年,中国IDC市场复合增长率达到38.6%。IDC市场快速增长对管理维护提出了更高的要求,本文结合某IDC托管数据中心布线系统介绍下罗森伯格Pyxis智能基础设施管理系统的方案应用。
一,IDC数据中心综合布线系统整体规划特点
IDC(Internet Data Center)即互联网数据中心,IDC主机托管主要应用范围是网站发布、虚拟主机和电子商务等。它是伴随着互联网不断发展的需求而迅速发展起来的,IDC不仅是数据存储的中心,而且是数据流通的中心,它应该出现在Internet网络中数据交换最集中的地方。IDC是伴随着人们对主机托管和虚拟主机服务提出了更高要求的状况而产生的,是Internet企业分工更加细化的产物。
IDC市场快速增长的同时,面对更多的挑战和要求,公有云凭借快速部署、易扩展性和低廉的价格对中小客户的吸引力越来越大,其增长速度达到传统IDC托管业务的2倍,传统IDC托管市场正面临着前所未有的挑战;客户对安全性和可用性的要求也随着云计算的发展而逐渐提升,为减少传统数据中心宕机所造成的巨大风险,建设分布式数据中心,通过统一的平台进行集中化管理也是IDC数据中心发展的趋势。
综合布线系统作为数据传输的物理通道,其重要性不言而喻。在规划和设计时,必须充分考虑IDC的应用需求和发展趋势,保障现有系统的稳定可靠性的同时,兼顾今后的扩展升级。传统IDC数据中心综合布线系统一般主要考虑以下几点:
可靠性高:数据中心的稳定性和安全性是最重要的,任何业务的中断都会造成重大的经济损失及严重的社会影响。系统架构应在数据中心标准TIA-942-A的规划要求下,采用更高等级的布线方案,包括产品的性能,安装的工艺,防火阻燃能力等。
扩展性高:随着互联网众多新技术和应用的层出不穷,服务器的装机量快速增长,带宽的要求越来越高。布线系统设计时必须考虑部分冗余,同时布线产品具备一定的扩展功能。
利用率高:机柜密度不断的提高,单机柜支持服务器数量大幅提升,布线系统在采用高密度方案的同时,如何充分的利用空闲冗余链路,通过及时切换端口,最大可能的提升数据传输通道的负载能力,已经是IT运维管理能力的重要体现之一。
即时性高:IDC托管业务繁多,不同等级的客户数量众多,日常运维的主要工作为工单任务和告警处理,布线系统物理链路及其对应端口必须被快速的查找并定位,才能及时有效的保障链路的及时通讯和数据传输。
传统的布线系统已经无法有效全面的满足高级别的IDC数据中心新的运维需求,因而,高效率的智能布线管理系统将被越来越多的引入了IDC综合布线系统解决方案。智能布线管理系统由软件和硬件组成,在不改变布线结构的情况下,通过有源模块监测跳线的实时连接状态,从而改善了运维管理的效率,降低了人力维护的成本和时间,及时有效的保障业务应用的快速实现。
二, 某IDC数据中心智能布线管理总体方案
某IDC托管数据中心采用ANSI&TIA-942 Tier4的标准设计建造,集DC,Telehuose,DR,NOC,SOC等服务于一体的新一代复合型数据中心;独门独院,6层建筑,抗震7级,总面积13000平方米,其中5层和6层为办公区,1层(含动力区)到4层为生产区,约1500机柜;电力SLA承诺可达99.995%;专业(非外包)运营人员超过百人,支持同城异地灾备,具有完善的安全管理体系。凭借超过十五年的运营经验,屡次获得年度最佳数据中心运维服务商。
该项目设计之初采用的为非智能普通布线系统,随着项目基建逐步完成以及客户的入驻意向洽谈中提出更高的服务要求,运营方意识到传统的人工管理维护模式效率低下,为了提升服务等级和品牌效应,提高管理效率,节省运营成本,运营方决定变更数据中心布线系统的设计,采用智能布线系统,使用电子配线架,代替传统普通非智能配线架,配合智能布线系统软件,实现对基础物理布线的监测,从而弥补了网络OSI七层模型监控管理的最后一块短板—物理层的监控。借助电子化的软件平台和配线架端口LED灯,维护人员可以快速根据提示信息,缩小物理故障范围,减少故障排除时间,提高整体维护效率,帮助维护人员从传统繁琐耗时的人工操作中解脱出来。
该项目在地下1层和1层设置两个运营商接入数据中心,两接入数据中心采用96芯万兆OM3光缆互连,1层到4层共7个弱电数据中心,两接入数据中心到每一个弱电数据中心分别配置48芯万兆OM3光缆,每个楼层的弱电数据中心到其对应列头柜配置1600芯光缆和800根铜缆,列头处采用交叉互连的方式,然后通过水平布线到客户机柜,平均每个客户机柜配置8芯光缆和4根铜缆。不考虑后期扩容,目前接入数据中心到弱电数据中心为768芯光缆(含互连),弱电数据中心到列头柜的主干为11200芯光缆,5600根铜缆,列头柜到客户机柜同样为11200芯光缆,5600根铜缆。从接入数据中心到列头柜主要为运营方负责维护,客户机柜主要由客户自己负责维护,或者与运营方共同维护。
IDC托管数据中心对物理链路维护的重点在于新增物理链路和链路故障排除。通过分配原有空闲链路,连接跳线完成工单任务,同时通过切换链路和插拔跳线进行告警排除。整条链路通道由运营方和客户分段维护,因此很容易造成维护时沟通困难,甚至责任区分,大大增加了故障排除时间。因此,为了提升整体的维护服务质量,降低故障风险和人力成本,充分考虑投资回报率的情况下,从以下3个方面进行了选型评估,最终该项目决定采用罗森伯格智能布线系统。
三,适用于IDC数据中心智能布线架构
1,电子配线架的布线架构
电子配线架的布线架构主要有两种:单配架架构和双配架架构。单配型采用电子配线架代替原普通配线架,主要为端口型电子配线架,配线架数量不变,然后通过跳线连接到交换机。日常维护操作的主要对象为交换机端口到电配端口的跳线。连接时,跳线必须先跳接交换机端口,然后再跳接电配端口,但是,电配系统只能通过电配端口的触发感应到这一端连接,另一端交换机端口确认连通必须软件即时通过SNMP协议从交换机的MIB获取到交换机端口的状态由Down变为Up,端口获取到终端设备MAC。交换机要求具备SNMP功能并打开,允许电配软件对MIB信息进行读取,因而管理上也存在一定的风险。如果同时有多条链路连通,很容易引起误判。拔除或变更跳线时,同样必须先拔除电配端,再拔除交换机端。一旦链路中断,非线缆本身连通质量问题,如先拔除交换机端跳线,交换机端口损坏,终端服务器宕机,或服务器端跳线拔除,软件无法识别并帮助维护人员缩小故障范围。
双配架结构在单电子配线架的基础上,增加一个电子配线架映射交换机,该电子配线架和交换机之间通过非智能跳线连接,双配架结构将日常操作维护的对象由交换机端口到配架端口变更为配架端口到配架端口,即时检测跳线两端的连通情况。
这样,正常的跳线插拔操作都可以实现监测,避免单配架结构只能监测一端的情况,从整体上提高了管理的可靠性和效率性,真正实现维护操作的电子化管理。
2,电子配线架的检测技术
电子配线架的检测技术有很多种,不同厂家的技术和连接架构均有不同,主要分为端口型和链路型两大类。端口型又分为端口感应型(如电子微开关,红外感应)和端口识别型(如RFID,CPID);链路型主要分为九针链路型和十针链路型。
端口感应型主要依靠配线架端口对跳线接头的物理感来判断跳线的插拔情况,通过触发的方式进行检测。优点是结构简单,成本相对较低,可使用普通8芯跳线。缺点是容易造成误判,把其他类型的跳线甚至其他物体(如手指,水晶头等)误判为实际所需跳线上报给软件平台;因只检测端口,即只能检测跳线的两端接头,无法检测跳线本身线缆,插拔操作时必须按两端一一对应插拔,否则同时插入两根跳线的同一端,会被误判为同一根跳线的两端。跳接关系在最初建立数据库的时候必须正确的进行物理跳线,否则一旦出错后期很难查得出来。
端口识别型主要通过配线架端口的读取器,跳线安装时,读取预置在跳线两端接头上的芯片信息来建立跳线的跳接关系。优点是信息存储量大,可以自定义端口和链路以及跳线的相关基本信息。缺点是成本相对较高,需在跳线端头上加装芯片同样只能检测跳线的两端接头,无法检测跳线本身线缆,插拔操作时必须按两端一一对应插拔,否则同时插入两根跳线的同一端,会被误判为同一根跳线的两端。
链路型主要采用9针或10针的模块和跳线,通过额外的Pin针形成检测回路,通过回路将检测信号传递给扫描模块,然后上报给软件平台。链路型最大优势是实时的在线监测,通过数据库对比检测的方式,无论何种情况下的插拔连接,均可以自动识别并进行相应的告警。同时可以批量进行跳线的跳接操作,所有的操作通过LED灯指引,不用担心跳错端口。批量跳接时,即可以先下任务,再进行物理跳接,也可以先批量进行物理跳接,然后再通过软件告警平台进行确认,消除告警确认连接。另外对智能跳线本身也有一定的检测功能,一旦跳线受外力断裂,同时影响到检测回路,即时产生告警。
另外,9针链路型和10针链路型不但在结构上存在区别,同时电配的扫描方式也不同。9针跳线采用非标准RJ45水晶头,增加了额外的检测探针;10针跳线采用标准RJ45水晶头,在标准8针的两侧0Pin和9Pin的位置增加用于检测的2根探针,相应的RJ45模块也增加了2针。9针链路型系统采用单片机串行扫描方式,针对配线架采用逐一扫描的方式,扫描周期较长,一般至少几分钟;10针链路型系统采用芯片方式的并行扫描方式,支持24路同时扫描,扫描周期较短,几秒钟即可完成。
3,电子配线架的部署方式
电子配线架的部署方式分为串行和并行两大类。
串行方式就是常说的菊花链式的总线结构,有源监控设备一般采用单片机的处理方式,通过串口线将数量不等的电子配线架一个一个串接起来。这样的连接方式结构比较简单,减少了有源控制设备的数量,但是可靠性具有一定的风险,一旦任一节点出现故障都会影响后续电子配线架的连接通讯。同时,电子配线架的供电需求增加,一般3~4个电子配线架就需要增加一个额外的电源模块。在信号进行轮询处理时,只能通过菊花链式逐一对单个电子配线架进行扫描,整个扫描周期可能需要几分钟才能完成。
并行方式采用的树型拓扑结构,有源监控设备采用芯片的处理方式,提供12或24个管理口分别管理12或24个电子配线架,所有电子配线架的信号处理采用并发的连接方式,这样的方式可靠性较高,一旦发生故障,影响的范围较小。一般一个轮询周期可能只需要几秒钟即可完成,同时有源监控设备对电子配线架提供PoE供电,减少了电源模块的使用。有源监控设备通过IP接入管理网络,方便管理和维护,减少了交换机端口和IP资源的浪费。如果不采用有源监控设备,所有的电子配线架都需要分配一个IP地址,通过交换机端口才能被识别,对整体网络的管理带来了额外负担。
四,某IDC数据中心罗森伯格智能布线管理产品方案
罗森伯格的第二代智能布线管理系统Pyxis-II,包含监控主机,管理单元,光/铜电子配线架,光/铜智能跳线和OMC布线管理软件。Pyxis-II仍然采用十针链路技术的双配架结构,相比Pyxis-I,硬件上额外增加了监控主机,同时软件上也进行了优化升级。
针对本案例,Pyxis­-II 智能布线管理系统部署架构如下:
●监控主机一般部署在MDA或HDA配线柜内,就近监控管理单元。通过前置的LAN口,配置IP后接入用户管理网络,将监控数据上报给OMC布线软件,同时将软件的工单任务下发到管理单元。一台监控主机可以监测24台管理单元,如果网络端口数量超过单台监控主机的管理端口数,可以根据需要增加主机,OMC布线管理软件可以对多台主机合并管理,软硬件设计可以使用户实现不限规模按需扩展的需要。本案例中实际使用2台监控主机,用于管理40台管理单元。部分链路后期根据客户需求另行增加,因此相应的监控主机,管理单元,电子配线架也会在后期陆续添加。
●管理单元主要部署在HDA配线柜内,监测本配线柜或邻近HDA配线柜内的电子配线架。管理单元自带LCD显示屏和按键,可在现场进行链路查看以及相关操作。一台管理单元可以监控24个电子配线架。本案例中目前使用管理40台管理单元,分布在20个HDA配线柜,用于监控600+的光/铜电子配线架。
●光/铜电子配线架部署在MDA或HDA配线柜内,采用双配架结构,代替原普通单配线架。铜电子配线架包含24个十针的RJ45模块和有源扫描模块,RJ45模块可以单独拆卸,有源扫描模块通过管理单元进行PoE供电,自带24个LED指示灯。光电子配线架含3个24芯的LC接口模块组,可以实现1HU72芯,同时满足熔接式和预连接式两种方案;自带理线器,同样通过PoE供电。监控主机,管理单元和电子配线架之间均通过普通RJ45跳线进行连接通讯,无须其他接口的连接线。
●光/铜智能跳线比普通跳线多了2针,用于监控跳线和端口的连通性。智能跳线可自定义长度和颜色,出厂时均经过性能测试,具有唯一的SN号。智能跳线数量可根据实际使用链路数量进行配置。
●OMC布线管理软件只需配置一套即可满足多用户登陆,同时可以分别授予不同的权限。多部门多用户同时登陆维护时,可以分别进行查看,工单任务等操作。OMC布线管理软件采用图形化的机柜界面,所有的设备包含普通配线架,有源设备等都可以通过模板图形化显示在软件界面内。自带数据库备份工具,可以通过邮件或消息将告警和日志发送给网管或推送给统一的告警平台。OMC布线管理软件不定期进行优化升级,针对IDC数据中心维护特点,增加了跳线编号的添加和查询功能,针对一些特殊功能提供定制化的开发服务。
凭借多年来IDC托管数据中心提供的优质解决方案,罗森伯格智能布线系统获得中国数据中心产业联盟颁发“2013-2015年度数据中心优秀产品和解决方案”奖项。对于IDC数据中心而言,由于采用多种租用与托管的方式,IT基础设施的管理与维护相比传统EDC来说将更加复杂,而作为托管的IDC数据中心的稳定性与事故处理效率是衡量客户满意度的重要因素,所以引入适合的智能布线智能布线系统,有助于极大的提升IDC的管理与维护效率,提升数据中心整体运维