前言:
一般服务器都会搭建监控,既然监控有了,那么报警肯定是必不可少了。监控不管是cacti,nagios,zabbx等,报警不管飞信,微信,邮件,短信。只要适合管理员,帮助其及时掌握服务器的状态,那肯定能省不少的事情。笔者用的是邮件监控,而且是异地的。然后在qq里设置了代理报警。也就是邮件可以收到,只要qq或者微信都在线,也可以收到,用起来算是方便了。
问题:
事情并没有想象中的那么好啊!!!最近总是断断续续发邮件,特别郁闷。然而,今天花了一上午来排查。居然是一个可笑的问题导致的。网络带宽!
报警:(简单的截一部分的图)
排查:(当时想的先检查服务器)
1、检查双方服务是否正常运行。(netstat,ps等即可)。
2、检查监控里面配置是否正确(ip,密码等配置)。
3、检查服务器iptables防火墙和公司防火墙是否有策略阻挡。
4、检查日志,是否监控日志正常输出。
5、检查服务器硬件防火墙是否正常(虽然断断续续,但毕竟可以监测到,估计关系估计不大)。
。。。。。。
然而,并没有什么不正常!
突然想起来,记得前一段时间总是有人说网不好啥的,是不是和这有关系?
立刻登陆路由器看配置了那些东西,公司是100Mbps链路。给dhcp加上一些特定配置服务器,还剩下50Mbps,但是公司的人很多都会自己配置tcp/ip参数,因此,很多人的ip都不在dhcp之内,那么对这些人并没有限速,当然我服务器的ip也不在dhcp之内,当时想是不是这里的问题?
继续排查:
1、本地服务器先用本地流量监控一下。(比如iftop,自身监控等,流量走的确实不多)
2、实用curl获取公司网站,是否可以获取到(结果获取不到,一个页面需要1000kbps左右)
curl: (7) couldn‘t connect to host
那么,要不改一下带宽?
于是,把监控的带宽改成了3000kbps
然后实用curl,可以正常获取页面,十分钟内,监控邮件也正常!
好吧,暂时归咎网的问题吧!真逗!写个博客,调侃一下。