zabbix这个开源工具功能还是非常强大的,如果工作中使用了它。。总是出现问题或者采集不到数据无法监控等等。。。
1、agent端权限问题防火墙以及agent的版本等等,还有是否配置主动模式配置文件选项是否开启。
2、server中模板间隔时间,不是很重要或者间隔时间可以设置长一点。item是否改为主动选项,触发器,一些触发器可以设置为依赖关系来设置。触发器中表达式函数速度最快的是last和nodata,其他相应较慢。。如果逻辑错误会导致数据库查询很慢。其实agent端除了被动和主动模式外,还有trapper不过这个没咋研究过,回头研究下。。一些无关紧要的数据记录历史以及趋势图等等可以设置相对时间断点。
3、server端还是有压力的,多设置几个proxy,缓解下server端的压力,数据主动发给server发送时间等等都可以设置下,数据库和server最好分开,其实大部分都是数据库读写的压力,数据库这个其实不懂呀,不过可以使用那个InfluxDB来做。抽空看看这个。。还有关于报警这个事,关系到业务重要的紧急的事情优先报警等等。可以搞个触发的优先级。。先这样吧。。
4、机器较多的话,可以设置自动发现功能,或者自动注册等等。。批量管理的工具比较多salt、ansible、puppet、cmdb、实在是都不敢兴趣自己写,你懂的。。、
以后想起来在写吧,这些都是记录一点小皮毛而已。。
时间: 2024-10-09 10:58:19