生产上有一需求,要把某个文件同步到另一台备机上,备机启动程序的时候需要引用这个文件,以便能够实现failover。文件同步的方法这里不言,这里主要讨论怎么通过zabbix平台实现对两个位于不同机器上的文件是否一致进行监控,若出现不一致的情况立即告警,需要人为干预。
在网上也搜索了好多帖子,差不多都使用了脚本来实现,感觉都不适合自己。于是曲曲折折走了一段弯路,最开始打算用Python脚本实现的,脚本都准备好了也测试过了。后来看到了calculate item这种方式,只是单纯的通过zabbix就能实现了,所以何乐而不为呢,于是就用这种方案了。现在把最后方案整理一下,与大家分享一下。
一、首先创建合适的基础监控项
我一开始就考虑着使用vfs.file.md5sum和vfs.file.cksum这两个item来实现。后来操作起来发现vfs.file.cksum比较适合,因为vfs.file.cksum的返回值是一串数字,便于下一步计算。
1.首先在源主机上创建一个item(注意这里面的Key和Type of information参数设置)
2.备机上同样的方法创建一个item(这里不贴图了)
二、使用item类型中的Calculated来实现两个监控项之间的比较
用calculate可以对item进行计算,计算方式主要靠一系列的表达式组成。计算后的结果存放在数据库中,也就是说历史数据、趋势数据都会存在数据库中。这就意味着可以对calculate item监控项进行告警配置。详细介绍请点击链接
https://www.zabbix.com/documentation/2.4/manual/config/items/itemtypes/calculated
Key在每个HOST中都是唯一的,不能重复。其表达式如下:
func(<key>|<hostname:key>,<parameter1>,<parameter2>,...)
各个参数的含义如下图所示:
现在在备机上创建一个calculate item监控项,来比较两个文件是否一致。通过前者的cksum值与后者sksum作差运算
注:如果操作完成后中出现下面提示的错误,需要检查一下Type of information设置:
这里解释一下出现这个问题的原因:当前者cksum值比后面大的时候正常显示,而当前值比后面小的时候就会出现上面这种结果,究其原因也就是类型不同其能包含的值也不同。
下面详细介绍一下item参数中的Type of information
Numeric(unsigned):64位无符号的整数
Numeric(float):浮点数类型(从zabbix2.2开始,接收的值大小可以支持如1e+70、1e-70.)
Character:字符(字符串)类型数据限制为255B
Log:日志文件,必须使用的Key为log[]和logrt[]
Text:文本(text)不限制大小
三、创建触发器,测试结果
在备机上创建一个触发器,当结果不为0时产生告警
手动操作一下让两个文件不一样时能立刻产生告警:
目的达成!