在数据中心生命周期中,数据中心运维管理是数据中心生命周期中最后一个、也是历时最长的一个阶段。数据中心运维管理系统就是为提供符合要求的信息系统服务,而对与该信息系统服务有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是信息系统服务有关各项管理工作的总称。对于很多数据中心来说,保障和提高数据中心运维管理绩效是现在数据中心亟待解决的问题。
教据中心建设作为一种战略投入基本上已经形成共识,但是在巨额的投入后仍面临着种种问题与风险,面临着数据量急速膨胀,场地严重不足,运营成本高昂、能耗大、安垒性差,业务连续能力低等一系列挑战。
那么在数据中心运维管理工作中到底存在哪些问题呢?
(1)运维人员不了解数据中心运维管理系统规划情况主要工作局现在对设备的维护上;
(2)简单的依照标准确定运维内容,包括一些不重要、无关紧要和不对的指标;
(3)机房环境指标指示不正常(温度、湿度、正压等),不知道如何改变制冷设备设置,使系统运行达到最佳状态;
(4)供电系统异常(接地、零地电压、干扰、IT设备异常)时,只知道在供电设备上查找原因,而最终不能解决问题;
(5)管理界限不清楚,只维护部分基础设施设备,忽略或不维护发电机和空调室外机等;
(6)只维护关键设备,对发电机、电池、配电、线缆长时间不做维护;
(7)设施文档不全面或不正确;
(8)发生事故时简单地归结为设备问题,不愿也无法找出引发事故的真正原因,以至于故障修复后再发生故障,或诱发其他环节故障。
(9)对设备和系统的智能监控管理功能不熟悉,已有的智能管理功能不能得到充分的利用。
(10)无专门维护人员配制,或维护人员不专业;
(11)管理制度不健全,缺乏维护操作流程,无严格的交接班制度。
这些问题无一不会对数据中心的运维工作带来挑战,只有正确解决这十一个方面的问题,才能让数据中心保持长期稳定运行,并能产生良好的效益;也是数据中心运维水平高低的主要重要体现,数据中心运维管理系统因此孕育而生。
原文地址:http://blog.51cto.com/13965328/2334681