前面学习了zabbix的工作原理和安装方法:
http://blog.51cto.com/user_index.php?action=addblog_new&job=modify&tid=1872382
今天我们学习zabbix 添加监控主机:
1、添加一台主机( 配置--主机--添加主机)
这样 node2 就被添加上来了。
2、添加node2 的应用集(aplication)
选择node2 应用集--创建应用集--名称为cpu stats (再创建一个memory stats)
3、添加item (选择node2 item--创建item)
注:如果监控网卡进/出站流量,先创建一个关于net 的aplication 再创建item,选择 item 时key 值选择 net.if.in[eth0,bytes]
4、 默认Item 有多种类型,
zabbix-agent 工作模式有:passive,active
网卡流量相关:
net.if.in [if,<mode>] //if 接口,如eth0 ;mode :bytes,packets,errors,dropped
net.if.out [if,<mode>]
net.if.total [if,<mode>]
监控端口相关:
net.tcp.listen [port] //监听了哪些端口
net.tcp.port [ip,<port>] //监听了某IP哪些端口
net.tcp.service [service,<ip>,<port>] //监听在哪个IP的服务,哪个端口
进程相关:
kernel.maxfiles //进程允许打开的最大连接数
kernel.maxproc //kernel允许运行的最大进程数
cpu相关:
system.cpu.intr //中断次数
system.cpu.load [<cpu>,<mode>] //cpu 的负载
自定义item:
关键:选取一个唯一的key:
命令:收集数据的命令或脚本
5、定义Triggers (可以存在依赖关系的组件)
选择node2--Triggers--创建Triggers
Trigger的状态一般就2种,要么OK ,要么Problem 超出定义的数值就显示Problem,即一个事件发生
每次接受到一个item的新数据时都会对item的当前采样值进行判断(与triggers的表达式比较)
一个triggers 只能属于一个item,一个item 可以有多个trigger
6、 定义Graph( 选择node2--Graph--创建Graph)
7、定义Actions
(1)触发条件一般为事件:
Trigger events: ok---problem
Discovery events: zabbix的network discovery 工作时发现主机
Auto registration events: 主动模式的agent注册时产生的事件
Internal events :Item 变成不再被支持或Trigger变成未知状态
(2)operations 的功能:
动作:send message 、Remote command
配置send message:
(1)定义media---(2)定义好用户---(3)配置要发送的消息---(4)报警升级
所以我们要定义一个操作时,事先要定义好media、用户等
8、定义media types
9、定义用户有三个选项,
(1)用户-----》
(2)报警媒介------》
(3)权限------!
11、定义好用户、报警媒介、权限后回头再来action的条件、操作等
这样就定制了一个完整的监控报警机制,一旦触发一个事件,就会以定义的媒介通知定义的管理员。