[运维] 第七篇:数据中心监控体系建设方法论

无论是传统数据中心,还是云时代的数据中心,运维监控都是运维工作的重点,而且运维监控是一个整体,你必须尽可能监控的全面和深入,你的监控数据才会更有价值,例如你想监控业务应用,可是如果没有基础监控数据(OS、数据库、中间件、网络等),你觉得你的监控会到位吗?那么如何建设一个全面和深入的监控体系呢?

        首先看监控体系的规划:

              再看监控体系的梳理:


           监控体系的落地思路:

            监控体系建设的持续改进:

           监控是一个从无到有,从点到面的过程,这个过程必然是在不断调整和适应中前进!无论是单个监控项目,还是监控体系整体,项目完成时,离当初建设目标最多也就是80%的趋近,另外20%是在以后漫长的运维过程中渐渐靠近,但永远也不能到达顶点,如果谁认为监控建好后,就会立刻达到目标值,那监控事实一定会让他沮丧,因为他总是发现有些东西还在报警范围之外找他的麻烦!

时间: 2024-12-09 05:52:04

[运维] 第七篇:数据中心监控体系建设方法论的相关文章

详解linux运维工程师高级篇(大数据安全方向)

详解linux运维工程师高级篇(大数据安全方向) hadoop安全目录: kerberos(已发布) elasticsearch knox oozie ranger apache sentry 简介: 从运维青铜到运维白银再到运维黄金,这里就要牵扯到方向问题也就是装备,根据自己的爱好,每个人都应该选择一个适合自己和喜欢自己的一个职业技术方向,如:大数据安全,开发运维,云计算运维等等.而掌握的越多前言技术也就是更多的装备,才能更好的在it行业混下去,毕竟it技术更新太快,初级篇和中级篇前面已介绍.

Linux运维第七课----Linux基础优化

一.find找出文件,并替换文件内容[[email protected] ~/data]# find /root/data/ -type f -name '.txt' ./oldboy.txt./acheng.txt./magua.txt./op.txt1.方法一 [[email protected] ~/data]# find /root/data/ -type f -name '.txt' -exec sed -i 's#sh#hs#g'[[email protected] ~/data]#

袋鼠云数据中台专栏(七):用户标签体系建设的四字箴言

本文作者:子玺 袋鼠云数据中台解决方案专家.拥有近10年大数据从业经验,拥有PMP项目管理资格认证,精通数据类项目的开发实施和管理.曾服务过国家工商总局.北京市工商局.北京市财政局.广州开发区大数据局.平湖人社局.海盐人社局等行政单位,担任多个大型数据项目的数据应用咨询顾问/项目经理. 正文: 一.什么是用户画像?什么是标签? 当我们从互联网时代逐渐步入大数据时代后,企业及消费者行为不可避免地要面临一系列改变与重塑.其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是「可视化」的,然而,「

云计算数据中心安全体系架构浅析

建立数据中心的目的是为了更好地利用数据.挖掘数据,向数据要效益.在数据中心中应用云计算技术则是一个必然的趋势.而从数据中心获得效益就必须有一个相对安全稳定的环境作为支撑,因此研究云计算数据中心的信息安全体系架构具有重要意义. 在建设云计算数据中心时,由于资源整合程度和共享程度很高,不论是数据安全.应用安全还是虚拟化安全,都以服务的方式交付给数据中心用户.在这种建设思路的指引下,云计算数据中心的信息安全体系和传统数据中心的安全防护体系差别很大,像小鸟云数据中心都是基于业务驱动的分布式云数据中心架构

数据库监控体系建设(一)

这篇文章先总结一下数据库监控体系建设那些事儿,下一篇文章描述具体的详细部署过程 1. 背景 作为核心IT业务模块,数据库的重要性毋庸置疑,数据库的稳定运行直接关系到应用系统的可用.稳定.高效性.因此,为确保数据库稳定.高效的运行,我们需要面临如下两个挑战 1.        数据库运行过程中的危险因子,怎么及时发现? 2.        数据库发生故障或因某些原因导致处于不正常工作状态时,怎样及时发现? 为了解决上述的两个难点,必须建立数据库监控体系,7*24实时监控数据库的运行状态,在数据库即

[运维] 第三篇:漫谈数据中心运维自动化

运维自动化是从2010年以后起来的一个运维需求,10年之前,运维项目主要集中在监控和ITIL流程上,当时也有BMC Control-M等产品在推,但是客户接受程度和影响力不如监控和流程.10年之后,运维自动化提上日程,建行开始招运维自动化的标,IBM.BMC.HP都纷纷参与,测了三轮,最后HP opsware中标,只能说一句厉害!工商银行也在自己组织服务商做自己特色的运维自动化平台,做了3.4年,基本成型,服务商也做出了自己的运维自动化产品,正式推向市场.当时运维自动化的主要功能是五项:自动化巡

[运维] 第六篇:告警是数据中心运维的核心驱动力!

告警事件是数据中心运维的核心驱动力,我们做的所有运维工作都是要减少业务出现故障的概率,提供更高的业务可用性.不知道大家是否认可这句话?还是看这张图,通过这张图,把这个问题讲透:        作为综合事件管理平台自身,需要有这样几个部件:1 丰富事件接口.作为数据中心的核心驱动引擎,需要有丰富的事件接口可以将各种IT事件,甚至非IT事件接收过来,常见的接口有rest.web service.snmp.soap.socket.xml.文本.jdbc等.因为面对的对象不同,所以能够使用的方式是完全不

[运维] 第五篇:数据中心改善运维,ITIL与ISO20000如何选择?

企业数据中心需要改善运维现状,提高运维水平,更好的为业务服务,ITIL肯定是不二的选择,因为毕竟ITIL是运维方面的最佳实践.但是ITIL只是告诉你如何才能提高运维能力,但是并没有告诉你怎么才能在你的企业里做好ITIL的落地工作,进而真正对运维发挥效果,所以具体怎么做,还是得你按照ITIL的理念去结合企业实际情况去落地.落地的时候你可能会有两个选择,是通过ITIL流程落地呢?还是去通过ISO20000认证呢?          因为本文不是讲ITIL和ISO20000的帖子,所以具体的讲解可以通

聊聊运维(1)证明你是坏运维的七个迹象,不要做CPR运维

大部分运维都有迷茫的阶段 干上几年运维,肯定感到迷惑和彷徨,因为运维是一个要求沉下心来了,不断精益求精的职业,而当下的大背景是浮躁,运维不是小鲜肉,明显是一个收益低,见效慢的职业. 运维有没有前途? 论职位,在一般企业最高级别到中层: 论收入,在任何企业肯定不会超过核心业务部门员工收入: 论压力,出现问题,永远是运维在背锅,因为不管什么起因,最终的操作都是运维. 所以浮躁的运维也非常多,浮躁的运维通常有以下七个迹象之一: 一 从不或者很少备份 数据是企业运行的基石,备份是使自己处于不败之地的终极