zabbix监控软件的使用排错

在linux系统中,几乎所有运行的服务都会产生相对就的日志(log),所运行的程序在出错时都会有错误提示,即使没有任何提示也可以通过“echo $”来查看运行是否成功。使用zabbix已经有一段时间了,整理一下遇到过的问题和解决的方法以。

zabbix的日志存放在/tmp下,服务器端对应的日志是zabbix_server.log,被监控端对应的日志是zabbix_agentd.log.

一,zabbix服务是否已经开启成功

查看系统是否已经有zabbix进程正在运行 # ps aux |grep zabbix 查看系统是否已监听zabbix server和zabbix agent所使用的10050、10051端口 # netstat -nplut |grep zabbix 如果没有,则开启:#/etc/init.d/zabbix_server_ctl start #/etc/init.d/zabbix_agent_ctl start

特别需要注意的是:每次修改完配置文件之后都需要重新启动对应的zabbix server或者zabbix agentd。

部分运行脚本在做restart时无法关闭zabbix导致服务无法重新启动,可用kill的命令把zabbix相关的进程杀掉再启动。

二、zabbix_server.log出现的提示

2009:20121023:193549.354 Sending list of active checks to [192.168.30.3] failed: host [CentOS-3] not found

这是因为zabbix_agentd.conf配置文件中的Hostname与web中的主机名对应。

1.jpg (89.63 KB, 下载次数: 5)

下载附件  保存到相册

2014-10-14 13:05 上传

三、网页中了出现的错误

(1)

2.jpg (50.32 KB, 下载次数: 1)

下载附件  保存到相册

2014-10-14 13:05 上传

Get value from agent failed: cannot connect to [[192.168.30.2]:10050]: [111] Connection refused

192.168.30.2是我的zabbix server服务器,本身也有监控自己本身的agent功能。出现这种错误是因为忘记在zabbix服务器开户zabbix_agentd。在Last 20 issues中也有提示


Last 20 issues

Host Issue Last change Age Ack Actions
Zabbix server Server Zabbix server is unreachable 23 Oct 2012 18:42:14 6m 57s No

-

解决方法:开启zabbix_agentd即可。

(2)

3.jpg (29.34 KB, 下载次数: 1)

下载附件  保存到相册

2014-10-14 13:05 上传

Get value from agent failed: cannot connect to [[192.168.30.3]:10050]: [113] No route to host

看提示“No route to host”,与网络连接有关。排除的方法如下:

a)查看192.168.30.3这台机器是否已开机

b)在zabbix server端向这台机器ping,看网络是否通

c)用telnet 登录10050和10051端口,看该主机是否允许这两个端口通讯

d)查看iptables防火墙规则是否拦截10050、10051端口

(3)

4.jpg (94.98 KB, 下载次数: 1)

下载附件  保存到相册

2014-10-14 13:05 上传

网页中不停地有以下红色提示:

zabbix server is not running: the information displayed may not be current.

zabbix 遇到上面的问题

可以从以下几个方面入手检查,当然先查日志,如果不想查日志,先检查下面几项是否正常

1. selinux是否关闭。

2. zabbix web目录下面  $ZBX_SERVER 是否为ip,如果是localhost,ping下localhost是否能解析。

3.查看php的fsockopen模块是否启用。

zabbix server is running | No.

查看/tmp/zabbix_server.log和/tmp/zabbix_agent.log无任何异常。看zabbix_server和zabbix_agent进程、端口都正常……几翻google以后并尝试,终于得到了解决!

http://www.zabbix.com/forum/showthread.php?t=23878&page=3 这里面有说到zabbix受selinux的影响而已有这种错误提示。

http://www.zabbix.com/forum/showthread.php?t=25321 这里面说到了修改hostname为IP的做法。

我具体的做法是:

①查看selinux产生的log,确实有错误提示:

#tail -f /var/log/audit/audit.log

type=AVC msg=audit(1351863204.990:32): avc:  denied  { name_connect } for  pid=1575 comm="httpd" dest=10051 scontext=system_u:system_r:httpd_t:s0 tcontext=system_u:object_r:port_t:s0 tclass=tcp_socket

type=SYSCALL msg=audit(1351863204.990:32): arch=40000003 syscall=102 success=no exit=-13 a0=3 a1=bfd494b0 a2=b76b0ad8 a3=d items=0 ppid=1434 pid=1575 auid=4294967295 uid=48 gid=48 euid=48 suid=48 fsuid=48 egid=48 sgid=48 fsgid=48 tty=(none) ses=4294967295 comm="httpd" exe="/usr/sbin/httpd" subj=system_u:system_r:httpd_t:s0 key=(null)

②然后让selinux允许它通过

setsebool -P httpd_can_network_connect on

③编辑zabbix.conf.php文件,把$ZBX_SERVER的值改为本机的IP地址

$ZBX_SERVER  = ‘192.168.30.2‘; #######用IP代替hostname

④OK

四、

tail /tmp/zabbix_server.log  显示

50952:20141012:195519.884 One child process died (PID:51233,exitcode/signal:255). Exiting ...

表示一个子进程死掉,是一个zabbix内存溢出错误 (此错误同样会造成上面红色的闪烁)

更正:

  • vim /etc/zabbix/zabbix_server.conf
  • CacheSize=512M
  • 修改此值后OK

五、 tail /tmp/zabbix_server.log 显示

2552:20141012:211700.552 [Z3001] connection to database ‘zabbix‘ failed: [1040] Too many connections

是由于连接到数据库的数量比较多,mysql 默认的连接数是100,一般设置到500~1000比较合适,我们可以调大这个值:修改/etc/my.cnf这个文件,在[mysqld]中新增max_connections=1000

然后重启mysql和zabbix_server zabbix_agent

用户自定义脚本监控:

a)

有时候用户自定义的脚本运行的时间可能比较长,如超过10秒的20秒的。这时在执行zabbix_agentd -p 或者zabbix_agentd -t时就可能出现“Alarm clock”,从而得不到想要的结果。这是因为zabbix agentd配置文件中定义Timeout时间默认为3秒,脚本运行取结果的时间超过了3秒就会出现这种情况。

解决方法:编辑配置文件/etc/zabbix/zabbix_agentd.conf,找到"Timeout"把它定义为30秒或小于30秒。

b)

对a中的情况还需要注意对zabbix服务器端的配置,如我自己定义的脚本

UserParameter=ping.avgtime,ping 192.168.30.2 -c 10 -w 29 |grep ‘avg‘ |awk -F "/" ‘{print $5}‘ 对192.168.30.2 ping 10取平均值,-w参数是对ping限定时间为29秒

这个脚本运行的大概时间为10秒左右,此时在agent端虽然可以用zabbix_agentd -t得到结果,但是在zabbix服务器端日志会不断的出现

1762:20121023:191941.360 resuming Zabbix agent checks on host [Zabbix server]: connection restored

1761:20121023:191952.149 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: first network error, wait for 15 seconds

1762:20121023:192010.610 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: another network error, wait for 15 seconds

1762:20121023:192028.628 Zabbix agent item [ping.avgtime] on host [CentOS-3] failed: another network error, wait for 15 seconds

这样的错误日志,并且在web端也没有画出图来。

解决方法:

①编辑zabbix服务器端的配置文件/etc/zabbix/zabbix_server.conf找到"Timeout"把它定义为30秒或小于30秒。

②如果还有类似提示则应该是zabbix服务器的内存设置得太小了,加大服务器内存便可。

时间: 2024-08-24 15:37:57

zabbix监控软件的使用排错的相关文章

LNMP环境搭建(基于zabbix监控软件)

LNMP环境搭建(基于zabbix监控软件) 安装依赖包: yum -y install pcre  pcre-devel  openssl openssl-devel 安装nginx [[email protected] media]# tar zxvf nginx-1.6.0.tar.gz [[email protected] media]# cd nginx-1.6.0 [[email protected] nginx-1.6.0]# ./configure --prefix=/usr/l

zabbix监控软件

Zabbix监控软件重要组件Zabbix Server:负责接收组件Database storage:负责存储收集的信息Web interface:图形界面接口Proxy:分布式组件,可选安装Agent:负责收集被监控端的信息并传给Serverzabbix进程zabbix_agentd: C守护进程,负责收集传送zabbix_get: S端手动获取C信息程序zabbix_sender: C手动上传信息zabbix_server: S守护进程,负责接收zabbix_proxy: 代理进程监控架构:

Redis 学习(Zabbix 监控Redis)

前面redis的配置文件盒常用命令.redis info信息都解释完了,接下来就是监控我们的redis了,我使用的是zabbix监控软件,所有在这里我在这里详细介绍下怎么设置zabbix来监控reids,主要分为配置zabbix插件.插件脚本.创建模板监控项.创建图形几个方面. Redis 学习(配置文件和常用命令注释): http://54snow.blog.51cto.com/2690157/1537449 Redis 学习(Redis Info详细注释): http://54snow.bl

分布式zabbix监控平台汉化,中文乱码问题

zabbix监控软件一直对中文的支持较弱,zabbix汉化之后经常会发生发生中文字体乱码的情况.关于zabbix汉化方法可参考文章( zabbix监控平台汉化 http://koala003.blog.51cto.com/9996246/1683687) 这是由于zabbix对web端没有中文库支持较弱的缘故,所以我们需要做的是添加专业的中文字体库: 1. 添加中文字库 我们可以在本地的电脑上下载,也可以去网上下载,建议使用较为常用的中文字体库 本地中文字体库路径: C:\Windows\Fon

06: Zabbix基础 、 Zabbix监控实战 、 Zabbix报警机制

部署搭建Zabbix监控服务器 192.168.4.56 部署Zabbix监控服务运行环境 LAMP 安装Zabbix软件2.1 安装准备]# rpm -q gcc gcc-c++]# useradd zabbix 2.2 安装软件包]# tar -zxf zabbix-3.2.3.tar.gz]# cd zabbix-3.2.3/]# ./configure --prefix=/usr/local/zabbix --enable-server --enable-agent --with-mys

企业级监控软件使用zabbix key监控nginx status各种状态

因业务需要需要用zabbix来监控nginx status,具体是如下的做法: 1. 首先在nginx的配置文件中添加如下内容,需要注意的是nginx的文件格式,在allow中我们需要注意的是需要添加zabbix server的IP地址,不然无法采集到数据, 2. 重启nginx服务器查看nginx服务器是否能正常打开, Nginx status状态说明: Active connections: 35 对后端发起的活动链接数 server accepts handled requests 186

企业级开源监控软件zabbix

最快速的对一个开源软件有一定的认识和了解,最好的方法就是看官网介绍. ------付炜超 第一问:zabbix是什么? 答:Zabbix是专为监控的可用性和IT基础设施组件的性能极限的企业级软件,Zabbix是开源的,是在没有成本 第二问:zabbix可以干什么? 答:Zabbix它可以收集几乎无限的类型从网络数据.高性能实时监控意味着数以万计的服务器.虚拟机和网络设备可以同时监测.随着存储数据,可视化功能是可用的(概述.地图.图表.屏幕等),以及非常灵活的分析预警目的数据的方法. 第三问:为什

企业级监控软件使用zabbix监控IOPS

01.在服务端创建zabbix组 configuration---Templates---create template---Template Linux  Disk IO===其中选择组为"Template" 在Template Linux Disk IO中创建Discovery rule: Name: Disk device  discovery Key: custom.vfs.dev.discovery Filter Macro{#DISK} [email protected] 

分布式监控软件Zabbix

2.1 Zabbix简介 Zabbix是一个基于Web界面的,提供分布式系统监视以及网络监视功能的企业级的开源解决方案.Zabbix能监视各种网络参数,保证服务器的安全运营,并提供弹性的通知机制让系统管理员快速定位并解决存在的各种问题. 2.2 Zabbix架构 Zabbix由Zabbix Server与可选组件Zabbix Agent两部分构成: Zabbix Server可以通过SNMP.Zabbix agent.ping.端口监视等方法提供对远程服务器/网络状态的监视.数据收集等功能,可以