为什么对基础设施的监控变得如此重要?

稍微懂点云计算的人都知道三个概念:IaaS「Infrastructure as a Service」、PaaS「Platform-as-a-Service」和SaaS「Software-as-a-service」,其中 IaaS 就是我们常说的基础设施服务。

简单而言,IaaS 提供了云计算基础架构,包括服务器、存储、网络和操作系统。它作为一种按需服务,使得客户无需购买服务器、软件、数据库空间或网络设备,而只要按需购买这些资源的外包服务就可以了。但是购买了这些资源,并不意味着一劳永逸,这些资源能不能稳定、高效的工作?这其实是一个新的挑战!

为什么需要监控基础设施?

众所周知,几乎所有的应用程序通常都是运行在一个大型动态的环境上,它们依赖于成百上千台主机。当然,这样的方式非常有利于扩展,能够保证良好的用户体验。但是,对运维和业务人员来说,这简直就是「噩梦」,那些传统的监控方式已经跟不上云时代的要求了。

首先,人类已经很难从大规模海量的数据中识别出那些有问题的节点;其次,服务器本身也在不断的变化——根据企业的需求进行动态的拓展或者缩减,单个主机经常会出现响应问题;所以,区分出哪些服务器是否处于一个正常的状态并不是一件很简单的事情。那么,我们就需要一个现代化的监控平台:

第一,必须能够毫不费力地跟踪我们所有的服务器,并且能够在数据量激情的情况下保持稳定;

第二,必须能够分辨出那些可执行程序,尽可能少出现误报问题,还要避免「兴师动众」,反而忽略更重要的问题;

第三,必须能够收集足够多的信息,使我们能够快速诊断出问题发生的根本原因,当然,这也意味着我们的监控平台应该与关键技术相互配合;

第四,应该还能收集详尽的数据以供我们进行分析,并能保留长期的数据用于对未来趋势的预测;

第五,必须能够让我们监控到所有的主机状态,同时也能监测到特定属性的主机。

最后一点,这个作为我们「操作神经中枢」的监控平台,必须能够帮助我们的团队高效地发现潜在问题的信息,如果有一个可视化的仪表板那就更好了,这样就可以有助于我们进行快速、明确的团队沟通。

现有的免费解决方案都有哪些?

当然,现在有很多服务器端的监控软件,而且针对服务器的性能监控也是一个比较新的网络管理方向。现在市面上有不少免费的工具,包括不少开源的产品如 Nagios ,Zabbix 等等,当然,还有一些比较有技术底蕴的公司,像国内 APM 行业的领军企业 OneAPM 也推出了免费的服务器监控产品 OneAPM Servers。

Zabbix

Zabbix 是一个基于 WEB 界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位,解决存在的各种问题。

Zabbix 由两部分构成,Zabbix server 与可选组件 Zabbix agent,Zabbix server 可以通过 SNMP,Zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在 Linux、Solaris、HP-UX、AIX,Free BSD、Open BSD以及OS X 等平台上。

Zabbix 主要功能包括: CPU 负荷,内存使用,磁盘使用,网络状况,端口监视,日志监视等等。

Nagios

Nagios 是一款开源的免费网络监视工具,能有效监控 Windows、Linux 和 Unix 的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。

Nagios 可以监控的功能包括:监控网络服务;监控主机资源;简单地插件设计使得用户可以方便地扩展自己服务的检测方法;并行服务检查机制;具备定义网络分层结构的能力;报警「通过 EMail、短信、用户定义方式」;定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;自动的日志滚动功能;支持并实现对主机的冗余监控;可选的 WEB 界面用于查看当前的网络状态、通知和故障历史、日志文件等。

OneAPM Servers:完全免费的专业级服务器监控产品

OneAPM Servers 是一款商业级的服务器监控产品。对比开源产品来讲,在部署安装和学习成本上都占据压倒性的优势。更重要的是,该产品是面向所有用户的性能监控,承诺永久免费,所以刚推出不久就受到很多的关注。

简易部署

如果,你想要使用服务器监控,只需要完成以下四个步骤:

  • 注册登录 OneAPM 账户;
  • 点击菜单栏的「服务器监控」;
  • 点击页面左上角的「添加」按钮;
  • 进入安装页面后,按照安装步骤执行即可。

特色功能

OneAPM Servers 通过观察、分析关键的系统参数,包括 CPU 利用率、物理内存、网络活动、进程、磁盘利用率及容量,展现当前服务器的健康状况。OneAPM Servers 目前包含四大功能:

  • 总览:显示服务器的大体健康情况;
  • 磁盘:展示每一个磁盘的负载及空闲空间;
  • 网络:查看一段时间内宽带「 Kb/s 」,每秒钟传输的包的数量,每秒钟错误率相关细节信息;
  • 进程:展示被监测的服务器上各个系统和用户进程的运行情况。

现在,OneAPM 刚刚推出不久的 OneAPM Servers 产品能够对企业 IDC 和云计算中心内的基础组件进行实时的可视化管理。该套件为用户提供基础组件的集中监控、展现、预警、分析、管控的整体解决方案。通过单一探针,实现对网络设备、主机、操作系统、中间件、数据库、存储等126 种产品的 5 万多项性能指标的集中监控和管理。

时间: 2024-08-27 14:53:44

为什么对基础设施的监控变得如此重要?的相关文章

谈谈互联网后端基础设施

对于一个互联网企业,后端服务是必不可少的一个组成部分.抛开业务应用来说,往下的基础服务设施做到哪些才能够保证业务的稳定可靠.易维护.高可用呢?纵观整个互联网技术体系再结合公司的目前状况,个人认为必不可少或者非常关键的后端基础技术/设施如下图所示: Api网关 业务应用和后端基础框架 缓存.数据库.搜索引擎.消息队列 文件存储 统一认证中心 单点登录系统 统一配置中心 服务治理框架 统一调度中心 统一日志服务 数据基础设施 故障监控 扩展 这里的后端基础设施主要指的是应用在线上稳定运行需要依赖的关

谈谈互联网后端基础设施(转)

谈谈互联网后端基础设施 来自:http://chuansong.me/n/717637351233 对于一个互联网企业,后端服务是必不可少的一个组成部分.抛开业务应用来说,往下的基础服务设施做到哪些才能够保证业务的稳定可靠.易维护.高可用呢?纵观整个互联网技术体系再结合公司的目前状况,个人认为必不可少或者非常关键的后端基础技术/设施如下图所示: Api网关 业务应用和后端基础框架 缓存.数据库.搜索引擎.消息队列 文件存储 统一认证中心 单点登录系统 统一配置中心 服务治理框架 统一调度中心 统

交通部第五号令对gps监控平台运营商影响重大,进一步加强北斗部标标准推进工作

交通部下文件强制要求货车卡车客车年检上牌装北斗一体机的通知,让货车车主蒙圈了.根据国家交通部2014年5号令的规定,半挂牵引车以及载货汽车(总质量为12吨及以上)必须于2015年底以前全部安装符合要求的北斗定位车载终端,并接入交通部认可的"道路货运车辆平台",否则不予发放或者验审<道路运输证>. 近期,由交通运输部.公安部.国家安全生产监督管理总局发布的<道路运输车辆动态监督管理办法>(2014年第5号令)是道路运输行业的最新政策,对卫星导航产业而言无疑是一种兴

Apache Geronimo 监控

Apache Geronimo 是一款开源应用程序服务器,其允许开发人员和系统管理员创建可移植.可伸缩的企业应用程序,并且与已有技术集成. Applications Manager 让 Geronimo 服务器监控变得轻而易举,因为它可以让服务器以最高性能运行,并且在停机时仍保持监控.跟踪响应时长和内存使用情况 迅速响应可以确保服务器高效率运行.Applications Manager 在跟踪服务器响应时间的同时,还会密切关注服务器的堆内存和非堆内存用量.Applications Manager

完美的分布式监控系统——普罗米修斯

DevOps工程师或SRE工程师,可能都知道Prometheus普罗米修斯.Prometheus于2012年由SoundCloud创建,目前已经已发展为最热门的分布式监控系统.Prometheus完全开源的,被很多云厂商(架构)内置,在这些厂商(架构)中,可以简单部署Prometheus,用来监控整个云基础架构设施.比如DigitalOcean或Docker都是普罗米修斯作为基础监控. 希腊神话中,普罗米修斯是最具智慧的神明之一,是泰坦巨神后代,其名字意思为"先见之明",那么以该名字命

在线公开课 | 京东云监控系统设计及落地之路

谈运维为什么离不开监控?典型监控系统一般是如何设计的?业务驱动的高可用监控系统又有何不同?作为巨头之一的电商平台京东, 其基于京东云的监控系统是否有值得借鉴的地方?本文将解答这些问题.本文整理自 10 月 30 日由京东云开发者社区和英特尔联合举办的在线公开课,京东云工具产品研发部专家架构师颜志杰的在线课程演讲--业务驱动监控系统设计与落地. 世上没有百分百可靠的系统,程序.机器.网络都可能在运行中出现问题,进而导致服务异常, 带来金钱及品牌的损失,所以监控目标就是降低损失,通过发现.定位.解决

《微服务》九大特性重读笔记

http://blog.didispace.com/20160917-microservices-note/ 今天重读了Martin Fowler的<Microservices>,在此记录一下对九大特性的理解. 服务组件化 组件,是一个可以独立更换和升级的单元.就像PC中的CPU.内存.显卡.硬盘一样,独立且可以更换升级而不影响其他单元. 在"微服务"架构中,需要我们对服务进行组件化分解.服务,是一种进程外的组件,它通过http等通信协议进行协作,而不是传统组件以嵌入的方式

周鸿祎发声了:我们不追逐最热门的东西

导语:面对着外界对360的质疑,对周鸿祎的质疑,周鸿祎淡然出声:360不追逐最热门的东西,因为中国互联网从来不缺热点.我们专注于我们的核心竞争力. 5月20日消息,2014年的360正遭遇一阵质疑,与几年前迅猛的在各个业务线扩张相比,这一年360在新领域并未有太多声音,360董事长周鸿祎也被质疑老了.日前360董事长兼CEO周鸿祎发布内部公开信,告诫360员工勿盲目把360看成互联网巨头. 进入微软.亚马逊,谷歌等美国IT企业工作人才项目,起薪40万,百度搜索(MUMCS) 周鸿祎在信中说,从时

周鸿祎

文/周鸿祎来自微信公共号:财经十一人 在 BAT 的光芒下,在美团.小米构造的互联网第二阵营中,特别是在猎豹上市之后,360 多次欲言又止,一反常态.360 公关团队告诉财经十一人,老周在闭关思考 360 该做什么.不该做什么? 5 月 20 日,这是一个奇特的日子,曾传言刘强东为了爱,要在这一天 IPO,当然传言错了.老周却选择了这一天公开内部信,是否说明他对 360 爱的深沉?字里行间带有反思和理性,但也多有挑衅与批判,本性固然是难移的. 以下是周鸿祎最新内部信全文: 世界上最缺的是看得远的