监控系统在运维自动化里的角色,可以用下面三点来概括:
1、监控数据收集及可视化
2、异常数据报警
3、和其他系统协同工作。
使用zabbix时,一般需要在被监控的服务器上安装Zabbix Agent,Zabbix Server 会和Zabbix Agent进行过通信,获取监控数据,这是Zabbix监控的一般模式。
选择Zabbix的理由:
- 监控系统能够自定义监控的内容,可以自己写脚本来收集需要的数据
- 数据要保存在数据库中,这样在需要的时候可以对这些数据进行分析计算
- 能够方便、快速得将监控加入到服务器上,不需要繁琐的操作
- 数据可视化不要很花哨,但要好用
- 可以定义复杂啊的报警逻辑,做到Item之间的关联报警,而不是只能针对一个
- 报警需要被确认,让运维人员知道多少报警已经有人认领并开始处理了
- 报警方式要能够自定义,可以发邮件、发短信
- 报警内容要自己可设置,在报警右键中加入一些简单的分析人,而不是让运维人员上服务器敲命令来获取基本的信息
- 报警后可以自动跑一些命令。这些命令可以是获取运维人员需要的信息,也可以是自动修复,比如重启服务等。
- 有强大的API可以使用,可以让其他系统来调用完成工作。
- 监控数据是开放的,数据库中的数据结构发不要太复杂,让人无从下手
- 监控可视化的图可以方便的引用,而不是要用一大串JavaScript
Zabbix Server:Zabbix的控制中心,收集数据、写入数据库都是它的干工作。
Zabbix Agent:部署在被监控服务器上的一个进程,负责和Zabbix Server交互,执行命令。
Host:广义上的服务器,大多数情况指代的是刀片机这类,在少部分时间会知道包括交换机在呢诶的,被Zabbix 监控的实体。
Item:对于某一个指标的监控,对应的是Items,英文愿意是“物品”。比如某台服务器的CPU负载就是一个Item。
Trigger:一些逻辑规则的组合,它有三个值:正常、异常、未知、
Action:当Trigger符合某个值的时候,Zabbix会进行的操作,比如常见的发邮件。
原文地址:https://www.cnblogs.com/yuzhou133/p/12168179.html
时间: 2024-10-29 19:09:57