清除信号量队列导致zabbix自动关闭

前几天在海外UCloud机器上部署了一套zabbix proxy和zabbix agentd,可是第二天一大早就收到邮件说zabbix_proxy挂掉了,上去查一下发现两台机器中的一台的proxy和agentd都挂了,而另一台没事,再查一下log日志:

zabbix_agentd [12977]: [file:‘cpustat.c‘,line:235] lock failed: [22] Invalid argument
 12976:20150305:022001.966 One child process died (PID:12977,exitcode/signal:255). Exiting ...
 12976:20150305:022003.967 Zabbix Agent stopped. Zabbix 2.0.13 (revision 48919).

zabbix_proxy [12970]: [file:‘selfmon.c‘,line:341] lock failed: [22] Invalid argument
zabbix_proxy [12972]: [file:‘selfmon.c‘,line:341] lock failed: [22] Invalid argument
zabbix_proxy [12973]: [file:‘selfmon.c‘,line:341] lock failed: [22] Invalid argument
 12951:20150305:022001.362 One child process died (PID:12970,exitcode/signal:255). Exiting ...
 12951:20150305:022003.365 syncing history data...
zabbix_proxy [12951]: [file:‘dbcache.c‘,line:2196] lock failed: [22] Invalid argument

第一感觉就是crontab跑了一个什么脚本,删除了啥东西导致的,果不其然,的确是删除了信号量导致的(关于信号量的介绍参看大牛博客 ipcs介绍 ),删除脚本如下:

#!/bin/sh
for semid in `ipcs -s | cut -f2 -d" "`
do
    ipcrm -s $semid
done

这么粗暴的删除,不出事才怪呢,加个删除条件:

#!/bin/sh
for semid in `ipcs -s | grep -v zabbix | cut -f2 -d" "`
do
    ipcrm -s $semid
done

再跑一下脚本,没问题啦 ^_^

时间: 2025-01-01 23:16:38

清除信号量队列导致zabbix自动关闭的相关文章

清除打印机队列中无法清除的任务 & 清空打印池

故障现象典型表现为以下两种情况 1.当打印任务开始进行时,这些打印任务便被保存在打印作业列表(也称打印队列)内.如果打印机因意外暂停(如打印机未连接)而未完成打印任务,则该打印任务将列入打印队列,并且存入文件的打印池,备份.进行备份的打印任务,如果不加以清除,后面的打印任务无法执行,导致打印机无法继续打印. 2.打印机的打印列表里,一个文档,无法打印,也无法删除.重启动,故障依旧.那篇文档牢牢地占据了打印列表.尝试打印新的文档,居然是“打印到文件”.尝试删除打印机,准备重装打印机驱动,居然也不让

mime导致zabbix web页面css样式不能显示的问题

在一台新系统上yum装完zabbix后发现web页面不能正确显示css样式表.页面如下图: 看了下目录发现.css文件和图片文件都在,不是文件路径的问题.百度了下发现是mime把text/css解析成text/html造成的.于是干脆找了一份比较全的mime.types文件放到/etc下,重命名为apache_mime.types.然后修改Apache的配置文件修改mime文件路径为/etc/apache_mime.types. 重启httpd服务并清除缓存后页面显示正常. mime.types

ucos事件邮箱信号量队列详解

Ucos的事件分为时钟,信号量,互斥性信号量,消息队列,以及消息邮箱 首先说信号量 信号量在ucos中的类型定义为OS_EVENT_TYPE_SEM,在任务控制块ecb中,主要是用到的是信号量计数器OSEventCnt,当有任务申请信号量的时候,如果信号量OSEventCnt的值大于0,则将OSEventCnt-1是任务继续运行,如果OSEventCnt已经为0,那么任务将会被挂到任务等代表中,当别的任务发送信号量的时候,被挂起的任务得到信号量,并设置为ready准备进行下一次调度,如果这时候任

因信号量问题导致ORA-27154无法启动数据库

测试库执行startup时提示(11.2.0.1): 查询ORA-27154的错误: Error: ORA-27154 Text: post/wait create failed --------------------------------------------------------------------------- Cause: internal error, multiple post/wait creates attempted simultaneously Action: c

服务器修改IP地址导致zabbix 不能连接mysql故障

一.故障说明: zabbix服务器IP 地址由192.168.1.226 改为192.168.1.73 访问zabbix时出现故障如下: 二.分析错误提示:连接数据库失败 解决思路: 1.在安装zabbix设定的数据库名称.端口.IP.账号.密码等,如果能修改此处设置的IP地址,问题可能会得到解决. 2.安装是填写的信息会生成一个配置文件,修改配置文件即可. #vi /etc/zabbix/web/zabbix.conf.php 三. 重启apache: #systemctl  restart

kernel.sem信号量参数调优,以及ipcs信号量队列查询

首先介绍下kernel.sem 这个参数 cat /proc/sys/kernel/sem 250     32000   32      128 或者 ipcs -ls ------ Semaphore Limits -------- max number of arrays = 128 max semaphores per array = 250 max semaphores system wide = 32000 max ops per semop call = 32 semaphore 

route -f清除路由表,导致localhost和127.0.0.1不能访问的解决方案

最近在折腾route命令的,一时手痒清除了路由表,如下命令 route -f 然后就蛋疼了,localhost和127.0.0.1,ping不通也打不开,最后在网上找到一条命令,重置ipv4协议的,如下 netsh int ipv4 reset 执行后,重启电脑总算是正常了 /* 只要运行这一行就可以了 */ 这里也来讲讲route是如何工作的,route有三个命令,add添加,change修改,delete删除,如下命令是打印路由表 route print 我们首先会看到一个接口列表,最前面有

linux清除邮件队列

[[email protected] mail]#tmp=`mailq | grep -E "root" | awk '{print $1}'` [[email protected] mail]# echo $tmp 8F5B4C0653 9A100C065A [[email protected] mail]# for i in $tmp;do postsuper -d $i;done 版权声明:本文为博主原创文章,未经博主允许不得转载.

解决zabbix监控因php问题导致图形界面中文乱码方法

解决因编译php中添加了-enable-gd-jis-conv选项导致Zabbix监控系统图形界面中文乱码问题 现象: php编译参数: 说明: 如果PHP编译时启用–enable-gd-jis-conv选项的话,那么非ASCII字符(例如汉字.拼音.希腊文和箭头) 会被当成EUC-JP编码 (phpinfo中美其名曰“支持JIS编码的字体”), 从而导致乱码(由于西文字体没有假名或汉字,一般表现为全部是方框).imagettftext()函数是将字符写入到图片的函数,这个问题就是由这个函数导致