Docker运维必备:监控宝Docker监控试用手记

本文由肖远昊深度实践docker监控的报告

 

非常荣幸得到监控宝的邀请,试用了他们最近推出的新产品——Docker监控。

9月7日,中国APM厂商云智慧CloudWise正式发布上线Docker监控,该产品从部署到使用,整个过程都非常的简单。不仅能够实时监控宿主机和Docker容器的性能信息(包括CPU、Mem、磁盘、Net In/Out),还可以自定义相应的告警策略。以下将从部署、监控信息、告警这几个方面聊聊试用体会。大家可以[注册]监控宝,免费使用Docker监控。

部署流程

阅读了Dockone上的文章《扒一扒监控宝Docker监控的技术原理》,了解到Docker监控的实现是基于SmartAgent架构来完成的,整个部署过程在几分钟内便可以完成。

第一步,点击“创建监控项目”,输入基本信息,包括名称和监控频率后,就可以看到具体的部署步骤。

第二步,在监控机器上安装代理和Docker插件。

l  首先下载、解压和启动SendProxy,SendProxy是一个代理,作为发送引擎,可以在局域网内进行部署,将局域网内机器的监控信息高效地传输到云智慧的SaaS平台。SendProxy可以通过SendProxy.sh脚本进行启动,命令为 `./SendProxy.sh start`,执行之后,可以通过命令 `./SendProxy.sh status`来查看SendProxy的状态,如果“States”是“ok”状态,则表示SendProxy启动成功。

l  其次,下载、解压和启动Docker插件——Docker Agent,Docker Agent是Docker监控的主要模块,负责在监控机器上采集数据并通过SendProxy将数据传输到云智慧的SaaS平台,可直接使用start.sh脚本启动Docker Agent。

经过这两步后,在监控宝的Docker监控页面就可以看到,刚刚创建的监控项目已经获取到了监控机器上的数据了。

不知道大家会不会有个疑问,“数据是怎么定位到刚刚创建的监控项目?”斗胆猜测一下,创建监控项目时,输入的名称和设定的监控频率在保存监控项目后,将监控项目信息写入了Docker Agent的配置文件中,这样就能对应上这个监控项目了。但还有一个疑问,"那一个机器上如果有两个监控项目怎么办?",仔细想想,一台机器上只对应一个监控项目,而一个监控项目可以监控多台机器。

> 根据亲身实践,对于部署流程中遇到的问题,提几个小建议。

> (1)在部署提示中,向用户说明现在Docker Agent所支持的操作系统类型;

> (2)提示用户,监控项目和Docker插件的关联关系;

> (3)提示用户,如果Docker监控页面一直没有收到数据,可以使用bin目录下的docker_py脚本尝试Push监控信息。

监控信息展现

部署完成之后,可以进入具体的信息展示界面。所展示的信息比较全面,包括CPU、内存、磁盘和网络流量的监控信息以及监控机器上不同状态Docker容器的统计信息(这么全面的信息,妈妈再也不用担心Docker运维了)。以下就是监控信息的整体呈现。

监控信息统一使用折线图展示,比较直观,如果想知道具体数据的数值,可以在图表的右侧切换到数据视图。如果想知道某段时间内的数据,可以在页面最上方进行选择,默认提供了“今日”、“昨日”和“最近七天”这三个选项,当然也可以根据需要进行自定义时间范围。图标上的数据线免不了会出现重叠,可以通过点击上方的标题来关闭某些数据线。这些细节方便值得称赞。

具体数据数值的展示如下:

在具体类目监控信息的展示页面,比如说Net In/Out类目,可以看到不同容器的监控数据以及一些统计信息(最大值、平均值和最小值),默认情况下,会展示“资源消耗Top10”的10个容器,当然也可以通过左上角的下拉框选择具体某个容器的数据展示。

 

告警

告警功能,无疑是运维人员和开发者最重视的一个功能。在云智慧监控宝的Docker监控中,用户可以自定义告警设置。告警对象主要是针对容器的资源使用情况以及容器的存活率。

告警策略根据统计数据(平均值、和值)进行相应阈值的设定,高于、低于或者等于设定阈值时,进行相应告警。对于资源的使用情况,可以针对所有容器或者单个容器进行告警设置。

值得一提的是,监控宝的的告警方式非常全面,可以通过电子邮件、手机短信、电话语音、APP推送、微信等方式进行通知,特别是通过电话语音和微信的方式能保证你不漏掉任何重要的告警信息。

总体感受

自从Docker问世依赖,运维一直是Docker使用者的一个痛点。云智慧推出的Docker监控,填补了国内Docker监控的空白。从部署到监控,整体上的感觉就是简单易懂且易用。整个部署过程,只是简单地下载两个Zip安装包,然后修改相应权限,启动就好了,对于新手或者小白用户来说,这是非常简单的操作。

监控信息使用图表展示,但也没有忘记给需要具体数据的用户提供数据视图的接口,细节方面做的很到位。进入CPU、Mem等具体监控信息部分,能够看到具体单个容器的监控信息,效果不错。告警部分,策略比较明确,通过统计的平均值或者和值做衡量,以设定的条件和阀值来触发告警,可以对单个容器的某个性能监控信息做告警,还是比较细致的。

最后提个建议,是否能够加入“组”或者“集群”的相关概念,在监控展示时,可以选择展示这个“集群”的监控信息,在告警设置中,可以设定这个“集群”的告警信息。有时候在一个宿主机上会把几个容器当成一个集群来用,例如一个hadoop集群。如果对每个容器单独观察监控信息或者设置告警信息,就显得有些繁琐与不便。

最后,非常感谢监控宝给予了这次试用Docker监控的机会,希望监控宝能够给我们带来更多的惊喜。

监控宝Docker监控正在免费使用中,欢迎体验

时间: 2024-10-27 11:23:06

Docker运维必备:监控宝Docker监控试用手记的相关文章

云智慧监控宝Docker监控功能评测

之前看到dockone社区<[实战]五个Docker监控工具的对比>(http://dockone.io/article/397)的文章,前两天也尝试了新上线的Docker监控工具监控宝.想按照文章中包含的六项指标,对监控宝做一个评价.评测项目包括: 1.部署的难易 2.信息呈现的详细度 3.部署过程中日志的聚集程度 4.告警能力 5.是否可以监控非Docker的资源 6.成本 1.部署的难易 监控宝的Docker监控部署是击中监控工具里最简单的,只需要将Docker监控采集器(SendPro

自动化运维工具之Zabbix分布式监控应用(五)

分布式监控概述proxy and nodeZabbix常用3种架构-->Server-agent-->Server-Node-agent-->Server-Proxy-agent Zabbix能高效地监控分布式IT架构在大型环境中Zabbix提供两种解决方案-->使用代理(proxy)-->使用节点(node)Proxy or Node?-->代理(proxy)用于本区域数据收集,并将数据发送给server-->节点(node)提供完整的Zabbix server

优云云监控:先定一个运维小目标,比方监控它10000台主机

“想做世界最好是对的,但是最好先定一个能达到的小目标,比方说我先挣它一个亿.”,王首富云淡风轻地给各行各业提供了一个很好的Roadmap,包括我们运维.的确,如今数据中心的规模增长速度也已像一匹脱缰的野马,各地都频频建设起超大型数据中心.按工信部的定义,超大型是指规模大于等于一万个标准机架的数据中心,考虑到虚拟化技术的使用,实际上需要运维的主机规模很容易超过十万的级别.所以,首富说的目标离我们也不远,也许很快就可以达到. 而如此大规模的数据,其运维的难度可想而知,我们来逐个分析应对看看: 挑战一

Linux运维不可不知的性能监控和调试工具

Linux运维不可不知的性能监控和调试工具 1 nagios Nagios是一个开源监控解决方案,我觉得他可以监控一切 ,可以看一下我以前的文章:NAGIOS 2 ps #用来查看程序的运行情况 ps -ef |grep svr.py|grep -v grep |awk '{print $2}' #查看svr.py的进程pid号 14554 [email protected]:~> ps -e -o pid,args --forest #层次结构中的进程ID 3 free #查看系统的物理(RA

linux故障定位,运维必备

linux故障定位,运维必备 背景有时候会遇到一些疑难杂症,并且监控插件并不能一眼立马发现问题的根源.这时候就需要登录服务器进一步深入分析问题的根源.那么分析问题需要有一定的技术经验积累,并且有些问题涉及到的领域非常广,才能定位到问题.所以,分析问题和踩坑是非常锻炼一个人的成长和提升自我能力.如果我们有一套好的分析工具,那将是事半功倍,能够帮助大家快速定位问题,节省大家很多时间做更深入的事情. 说明本篇文章主要介绍各种问题定位的工具以及会结合案例分析问题. 分析问题的方法论套用5W2H方法,可以

02. SpringCloud实战项目-快速搭建Linux环境-运维必备

SpringCloud实战项目全套学习教程连载中 PassJava 学习教程 简介 PassJava-Learning项目是PassJava(佳必过)项目的学习教程.对架构.业务.技术要点进行讲解. PassJava 是一款Java面试刷题的开源系统,可以用零碎时间利用小程序查看常见面试题,夯实Java基础. PassJava 项目可以教会你如何搭建SpringBoot项目,Spring Cloud项目 采用流行的技术,如 SpringBoot.MyBatis.Redis. MySql. Mon

应用性能分析神器“透视宝”亮剑之监控宝API监控优化

作者:云智慧 Kevin Kong & Allen Zhang 企业IT部门在进行互联网/移动应用功能优化过程中最大的痛点在于,明明知道应用存在问题,却难于准确定位具体问题点并快速制定有效的解决方案,此时企业最需要有一套全栈应用性能监控.管理工具.透视宝是云智慧推出的新一代面向业务的端到端应用性能管理(APM)平台,针对移动和Web应用,提供全面的性能监控.分析与管理解决方案,本文将重点描述透视宝在优化云智慧旗下网络监控产品--监控宝API监控过程中起到的关键作用.一.监控宝API监控遇到的问题

自动化运维工具之Zabbix服务器监控基本应用详解(一)

Zabbix基本概述:Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案.它能监视各种网络参数,保证服务器系统的安全运营:并提供柔软的通知机制以让系统管理员快速定位/解决存在的各种问题. zabbix由zabbix server与可选组件zabbix agent构成:zabbix server:可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux, Solaris, H

运维人员的解放----Docker快速部署

Docker是一个用了一种新颖方式实现的超轻量虚拟机,在实现的原理和应用上还是和VM有巨大差别,专业的叫法是应用容器(Application Container).(我个人还是喜欢称虚拟机) Docker应用容器相对于 VM 有以下几个优点: 启动速度快,容器通常在一秒内可以启动,而 VM 通常要更久 资源利用率高,一台普通PC 可以跑上千个容器,你跑上千个 VM 试试 性能开销小, VM 通常需要额外的 CPU 和内存来完成 OS 的功能,这一部分占据了额外的资源 因为VM 的 Hypervi