告警概述
告警是监控的重要职能,是指将达到某一阈值时间的消息发给用户,让用户在事件发生的
时候即可知道监控项处于不正常状态,从而让用户来觉得是否采取相关措施。
在zabbix中,告警是由一系列的流程组成的,首先是触发器达到阈值,接下来是Action对
事件信息进行处理,其中包括两部分:第一部分是发送消息,即将告警信息发给用户;第
二部分是执行命令,即将事件用命令进行处理,达到时间故障自动尝试回复的效果。
zabbix的告警流程如下:
Host group(设备组) →Hosts(设备)→ Applications(监控项组)→ Items(监控项)→ Triggers
(触发器)→Actions(告警动作)→ Medias(告警方式)→ User Groups→ Users
Zabbix告警的配置步骤如下:
- 设置Trigger
- 配置用户
- 配置告警介质
- 设置Action
Trigger的配置
我们知道Items的作用是采集数据,而不是判断采集到的数据是否属于正常值;Trigger的作
用是对采集到的数据进行阈值状态的判断,出发阈值,则会产生一个事件,同时,Action对
达到条件的Trigger触发告警动作。
1.Tigger的状态如表
值 | 描述 |
---|---|
OK | 正常状态(老版本中是FALSE) |
PROBLEM | 有事件发生,例如,CPU负载过高(老版本中是TRUE) |
2.Trigger的配置步骤
Trigger的配置是通过单击菜单栏中的Configuration →Template/Hosts →Trigger → Create →trigger
这里以配置一个用户登录的触发器为例:
单击如图所示的Create trigger
单击如图“Add”按钮添加正规逻辑表达式
在Item下拉列表中选择Number of logged in users
其中的Function是触发器的函数表达式
选择Last函数。Last of为时间,Time shift为时间偏移,N为触发器的条件判断
配置后的选项如图
原文地址:http://blog.51cto.com/xuuuuuu/2085583
时间: 2024-10-12 00:48:59