数据中心的智能运维与节能

无人化数据中心难以实现?

如图所示,大部分运维人员理想中的数据中心是这样一种干净整洁,极少人员进出的熄灯状态。作为运维人员,减少无关人员进入机房的次数对于数据中心的信息安全非常重要。

然而,理想很丰满,现实却很骨感。现实中的数据中心往往是布线混乱,电灯长明,一出问题不管紧急不紧急就有人员进出的状况。


这种情况下,一是设备数据安全得不到有力的保障,二是一旦设备出现故障又是看设备运行提示灯状态又是查看运行日志来确定故障信息以及故障位置,耗时费力。因此,很多运维人员体会过其中的辛酸之后都在默默祈祷自己管理的设备不要出现故障。


网上流传种种运维人员的夸张图片虽说是自我讽刺,但另一方面又实实在在的反映出了机房运维的心酸与无奈。

与此同时,随着数据中心的设备数量的不断增长,机房管理方面对运维人员的要求也越来越多。当设备发生故障时,运维人员不能及时响并应解决问题对企业业务会造成一定的影响。但是因为传统的故障定位过程繁杂令人头痛,所以很多时候故障告警得不到及时响应。哪怕到最后故障问题解决了,但也花费了不少的时间。

近年来IDC的市场规模

数据中心能耗过高引起重视

根据调研机构Global Market Insights(GMI)的调查报告,由于数据中心的增长和存储的信息量剧增,数据中心冷却市场发展正在呈现爆炸式的增长。当今的技术驱动型世界需要一个能够保护系统和处理器免受高温和湿度损害的环境,同时又具有成本效益和环境友好性。

GMI公司2016年的调查报告表明,全球约有80亿美元用于数据中心冷却。到2024年,这一数字预计将达到200亿美元。由于冷却设备功耗约占数据中心能耗的40%,因此对具有成本效益和节能解决方案的需求变得前所未有的重要。

绿色节能对于数据中心而言已经不是一个锦上添花的议题,而是一个必须做好的课题,因为能源成本的占比正在不断攀升。

根据美国环境保护署EPA的报告,在数据中心的运维成本之中,场地基础设施能源成本则于多年前开始超越服务器的购买和运维成本。

对于企业级的数据中心而言,绿色节能意味着大量成本的节省(视规模的不同,大型数据中心的整体PUE值每下降0.1意味着每年电费可以降低数百万元到上千万元人民币)。

而对向外出租运营的数据中心而言,绿色节能则直接关系到自己的市场竞争力和盈利水平。

绿色节能作为新一代数据中心建设的核心理念之一,正受到国内外金融行业越来越多的关注。

2019年2月,工信部、国家×××管理局、×××近日联合印发《关于加强绿色数据中心建设的指导意见》(下简称《意见》),明确提出要建立健全绿色数据中心标准评价体系和能源资源监管体系,到2022年,数据中心平均能耗基本达到国际先进水平。

《意见》指出,引导大型和超大型数据中心设计电能使用效率值不高于1.4;力争通过改造使既有大型、超大型数据中心电能使用效率值不高于1.8。

然而,目前大部分的数据中心PUE值难以达到这一参考值,有的数据中心的PUE值甚至高于2.0。原因在于很多设备所需要的运行温度偏低,一旦提高数据中心的制冷温度,设备会因为温度过高而出现宕机,这样会造成企业业务中断的后果。因此很多数据中心不敢冒这样的风险来提高室内温度,所以PUE值也一直降不下去。

顶云运维平台是一款集中式带外管理平台,主要监测设备的物理状态,可提供部件级的监测。快速自动巡检,减少运维人员在数据中心里花费的设备巡检时间,精准定位设备故障,不必查看设备运行提示灯以及运行日志,运维人员可根据告警信息直接查看相应位置确定故障信息再进行相应的维修处理。

对于数据中心的能耗管理,顶云可根据自己的技术条件,实时监测每一台设备的实时功率以及设备进风口、出风口的温度。整个过程不需要外接只能PDU,更不需要改造数据中心,不会对用户产生硬件上花费。

顶云运维主要做到一下几点来为数据中心节约用电,降低PUE值:

电量测量

  • 识别用电峰值,确保机房用电安全。

    增加机架密度

  • 监测机架空间容量、耗电容量,合理利用机柜空间;
  • 增加机柜密度,延长数据中心使用寿命。

    识别僵尸服务器

  • 通过能耗监测,发现低负载或0负载服务器;
  • 提高服务器利用率,降低能耗浪费。

    识别功耗/温度故障

  • 结合功耗数据、以及温度数据的环比数据,发现设备异常,提早预测机器故障。

    功耗管理

  • 在预测用电情况、负载情况前提下,调整服务器用电策略、UPS用电策略,优化能源使用情况。

原文地址:https://blog.51cto.com/14121283/2395860

时间: 2024-10-05 03:56:15

数据中心的智能运维与节能的相关文章

数据中心的自动运维之路

自动化运维其实也算是老生常谈,一谈谈了十几年,但却一直没有质的提升.数据中心的运维工作反而变得越来越繁重与复杂,当然这和这些年数据中心巨大的变化紧密相关,数据中心承载的各种应用越来越多,运维工作也变得异常复杂,简单的自动化运维已经不能彻底解决数据中心运维工作效率低下的问题.以前,数据中心运维人员就像流水线上的一名工人,不断重复地做着同样的工作,枯燥又容易出错,自动化运维就是要引入一些工具,通过这些工具来替代运维人员来工作,从而减少人力成本,同时提升数据中心的运维水平. 那么自动化运维,其实就是向

智能运维解决方案:TOC -IT技术运行中心

TOC--IT技术运行中心(Technoical Operation Center )是网利友联在多年运维经验基础上,全新打造的一套综合智能运维解决方案. 运维现状 运维行业经过几十年的发展,基本上每个用户的信息中心都已经建立了一套完整的运维体系,这其中不乏最重要几个部分:人.物.数.业务在变,运维目标也在时刻发生着变化.如今的运维体系现状是有团队.有工具.有数据.但是面向智能运维生态的发展趋势,面对大数据分析计算场景,缺少的是数据汇聚.数据融合.告警关联分析.数据统一展现等.总结起来就是整个运

智和网管平台国产化AIOps智能运维 建立自主可控网络安全体系

没有网络安全就没有国家安全,中国作为一个崛起中的大国,网络安全至关重要.新一届中央高度重视信息安全自主可控的发展,Gartner研究报告表明,2019年中国三分之二的数据中心.IT基础设施支出流向中国本土厂商,因此,如智和网管平台SugarNMS以国产化.高拓展性为核心的智能化运维软件成为行业的前沿力量. 自主知识产权 全面深入IT国产化 IT国产化体系复杂,产业链涉及网络基础设施.服务器.存储.数据库.中间件.操作系统等众多环节.现在,服务器.PC和网络安全国产化率较高,如服务器领域依靠华为.

智能运维就是由 AI 代替运维人员?

听了有关AI运维之后有很多人感到比较焦虑,我所从事的运维或开发将来会不会被AI给替代掉呢? 现在新技术发展的特别快,各种语言.技术.理念让大家确实感到自顾不暇跟不上趟,但是有一点,在这里我要特别重申一下,AI在目前这个阶段还是一种辅助大家来进行判断和学习.定位处理问题的工具,就像无人驾驶,现在可以做到完全没有人驾驶吗?肯定不行,未来无人驾驶是完全可以替代人的,但它还有很长一段路要走.AI运维就像无人驾驶一样,未来前景很光明,但任重道远. 大部分的智能运维还没有完全落地,我所在的企业也是处在一个探

海量日志分析与智能运维

以下文字版根据<大咖·来了>第3期<海量日志分析与智能运维>整理,回放链接:http://aix.51cto.com/activity/10011.html?dk=wz 一.AIOps 与智能日志中心 1.1AIOps 五等级 要说智能日志中心,首先要了解什么是智能运维.目前业界对智能运维的运用,主要分为如下五个等级. 一级是最容易的,只要你有个想法试试就行,到网管监控系统里,拿一个监控指标的曲线下来,就可以尝试异常检测. 一级还没有成熟的单点应用,当有了一个成熟的单点应用,就算是

直击传统运维痛点,京东金融智能运维初探!

随着互联网+时代的到来,京东金融业务规模不断扩大,业务场景也不断创新.但是,业务变化之快超乎想象,相应的 SOA  及微服务架构日趋深入,服务数量不断膨胀,线上环境日益复杂,服务依赖关系每天都在变化. ● 如何实时看清系统的容量水位,为容量评估和系统扩容提供客观依据? ● 当故障发生时,如何精确判断影响范围? ● 如何确定每一次交易过程中,每个系统处理耗时分别是多少? ● 每个系统在处理一笔交易时,分别在数据库.NoSQL.缓存.日志.RPC.业务逻辑上耗时多少? ● 如何快速确定系统的真正瓶颈

智能运维:www6662016com从0搭建AIOps系统18288006666

互联网刚兴起的时候,运维还只是一个简单的服务安装管理及监控工作,没人会想到人类在互联网上建立了如此庞大的业务生态.从衣食住行到教育金融,服务器的规模在急剧膨胀,从简单的人力可管控,逐渐进化到依赖自动化体系来管理,但是另一方面,仅依赖工具已经不能很好地解决运维场景的需求.智能运维是建立在运维基础上,通过一定策略和算法来进行智能化诊断决策,以更快.更准确.更高效地完成运维工作的技术体系.要实现智能运维的目标,需要有平台支撑,这也是DevOps很火的原因,很多运维工程师都掌握了开发工具和平台的本领,因

基于PaddlePaddle的新能源充电桩智能运维

随着大数据.人工智能.云计算技术的日渐成熟和飞速发展,传统的运维技术和解决方案已经不能满足需求,智能运维已成为运维的热点领域.同时,为了满足大流量.用户高质量体验和用户分布地域广的互联网应用场景,大型分布式系统的部署方式也成为了高效运维的必然之选.如何提升运维的能力和效率,是保障业务高可用所面临的最大挑战.本篇文章以百度基于PaddlePaddle的新能源充电桩为切入点,深入介绍智能运维在电力行业的实际应用. 以下为演讲实录. 电力行业运维过程中的痛点与机遇 众所周知,典型电力行业包括发电.输电

Gartner中国智能运维市场指南发布,擎创再次成为AIOps代表供应商

近日,Gartner发布了<中国智能运维市场指南>(以下简称"<指南>"),擎创科技再次因为在智能运维领域产品的创新力及其成熟度,被Gartner提名为AIOps领域代表供应商.而在去年7月份,擎创就被Gartner评为中国AIOps领域重点推荐服务商. Gartner<指南>指出,在中国特有的生态环境系统下,全球性的IT巨头虽然进驻中国市场数十年,但是却难以在AIOps领域扩张.主要原因在于,这些全球性供应商提供的ITOM工具的许可证模式比较昂贵,