记一次varnish异常/故障

公司一varnish集群运行很久了，一直很稳定，没发现什么问题。最近开发那边反馈新传的静态文件访问不了。出现以下错误：

Error 503 Service Unavailable

Guru Meditation:

XID: 1267841165

cache server 5443

检查varnish启动配置，

ps -ef | grep varnish

usr/sbin/varnishd -P /var/run/varnish.pid -a :80 -f /etc/varnish/default.vcl -T 127.0.0.1:6082 -t 0 -w 100,30000,600 -s malloc,13G -p http_max_hdr 256 -p http_req_hdr_len 8192 -p http_resp_hdr_len 8192 -p thread_pool_max 9000 -p thread_pools 8 -p queue_max 600 -p listen_depth 8192 -p lru_interval 300 -p sess_timeout 60 -p gzip_level 8 -h classic,600007

判断不是这里有问题。

另外，服务器剩余内存还有很多，确定不是内存问题。

检查了后台静态文件服务器，也没发现问题。

重启varnish之后，503的问题暂时得以解决。但是发现新上传的静态文件还是503.

后来发现，varnish配置文件里，有一条检测后端健康状态的配置如下：

probe probe_ask_iis {

.interval = 60s;

.timeout = 5s;

.window = 10;

.threshold = 4;

.initial = 10;

.request =

"HEAD /css/305css.css HTTP/1.1"

"Host: www.ooxx.com"

"Connection: Close";

}

询问开发，开发说他们最近整理静态资源，shanchu（这2个字?也敏感?）了/css/305css.css文件，至此故障原因终于浮现。

解决：恢复了这个文件，按个重启varnish服务。

后话：本人觉得这个配置没有什么意义！

记一次varnish异常/故障,布布扣,bubuko.com

时间： 2024-08-22 20:00:50

记一次varnish异常/故障的相关文章

CentOS服务器上搭建Gitlab安装步骤、中文汉化详细步骤、日常管理以及异常故障排查

一, 服务器快速搭建gitlab方法可以参考gitlab中文社区的教程 centos7安装gitlab:https://www.gitlab.cc/downloads/#centos7 centos6安装gitlab:https://www.gitlab.cc/downloads/#centos6 如下方法按照官网来操作,手工安装过于麻烦.当前测试平台为小鸟云的三个月centos 7测试机. 1. 安装配置依赖项如想使用Postfix来发送邮件,在安装期间请选择'Internet Site

记一次网站访问故障

官网更新了一张图片和两个视频. 上传之后无法访问图片,检查配置文件.服务状态.日志,最终发现同一目录下旧图片可以访问,新的却有时可以有时不行. 忽然想到前阵子另一同事做了百度云加速,可能是用户访问被转到了百度云加速节点上,而这些节点尚未全部同步过来,又因为某些原因不能够做缓存(同一个客户访问时好时坏),所以才会出现这样尴尬的事情. 其他线索: 服务器流量被百度云节点占用() 页面打开开发者工具在图片页面上Network,能看到hit 云加速猜中的记录. 提到视频,当然还是不建议放在本地,放在云端

记一次zimbra服务器故障导致mysql起不来问题

记一次zimbra服务器故障导致mysql起不来问题服务器有一天突然访问不了,局域网连接不上,去机房查看,硬盘灯亮着,屏黑的,按电源键没法关机,没办法,只能强制关机了.强制关机后,启动起来,登陆进去看.zmcontrol status过了好久才出现内容,提示如下:Unable to determine enabled services from ldap. Unable to determine enabled services. Cache is out of date or doesn't

记一次无法远程故障排查20161211.2111

故障说明: 客户反馈无法远程连接:本地ping丢包率很大: 登陆查看: 丢包异常严重: 查看虚机,VMtools已过期,继而导致未正确获取IP地址: 登陆系统重新安装VMtools: ,,,,,,,,,,, 故障依旧尝试在cloudstack平台重新解绑策略: 故障依旧尝试重启系统后,本地ping虚机没有丢包,非常通畅, 两分钟后,继续丢包继而: 从虚机ping网关,通畅: 从虚机ping vr(virtualroute)通畅: 从虚机ping外网,不通: 从vr ping外网,通畅:

记一则Hadoop DataNode OOM故障,以及解决方案

一.故障症状最近公司一个集群跑大任务时,datanode日志报DataXceiveServer: Exiting due to:java.lang.OutOfMemoryError: unable to create new native thread异常,然后计算节点上的DataNode直接挂掉.DataNode异常日志截图如下: 2014-03-06 03:41:05,881 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: Da

记某校园无线网络故障排查

[问题描述]:某高校无线网络发射两个信号,一个为TEACHER,另一个为STUDENT,节前部署试运行阶段一切正常,节后学生返校开学,就开始有部分学生反映连接STUDENT信号不能上网,具体表现为,无线信号能连接上,但是无线终端(包括手机和笔记本)获取不到地址,直接分配169.254.175.149:而连接TEACHER信号的则一切正常.[问题排查]: 1.综合这几天故障申报的时间观察来看, 没有固定的时间段,基本上全天都会有几率出现故障现象: 2.排查TEACHER和STUDENT

MySQL异常故障总结

在2017年里,项目上的MySQL出了几个问题,记录总结一下,给自己一个教训! 废话不多说了,直接进入问题主题: 问题一:MySQL单表千万级数据量"add"字段异常分析问题描述:项目一个新功能,需要对有1200w+的表"tb_bw_mobile"新增2个字段"batch_num"."data_status":执行SQL月5-6分钟后,查询数据,发现未增加字段:约10-13分钟后limit 1.10.100条数据,均为发现有

记一次Postgresql异常中断导致的启动失败

由于异常导致了测试服务器的Pg11宕机,启动时候报错 2019-06-11 14:20:08.121 CST [9980] 致命错误: 数据库系统启动中 2019-06-11 14:20:08.121 CST [9981] 致命错误: 数据库系统启动中 2019-06-11 14:20:08.121 CST [9964] 致命错误: 数据库系统启动中 2019-06-11 14:20:08.121 CST [9970] 致命错误: 数据库系统启动中 2019-06-11 14:20:08.121

一次tcp连接被reset的异常故障排查

昨天有dev人员找到了我说线上访问外网的一个接口,访问均正常,但是在测试环境时通时不通,很奇怪,我也挺好奇,就跟进排查了下,情况大概如下: 测试机:l-qta20.h.beta.cn0 访问外网接口地址: http://xxx.xxx.xxx.xxx:7701/AboutMember.asmx 以下是在测试环境不通的时候,在测试环境用tcpdump抓包如下. 上图包含的内容为: 1. tcp三次握手已经完成 2. 并且连接处于数据传输的状态 3. post数据提交过去的时候,被对方reset了