线上网站网站报2002错误

每个周一都好累....................
每个周一都有那么多的问题 作为一个运维,并且是一个女生,心好累
好了,进入正题,这个周一先是数据库出问题,差点背上删库跑路的锅,不过还好,老天保佑我.............
此次线上的项目出问题了,用户反映观看我们的视频会出现 服务器错误信息,不过这个错误的话是瞬间性的,可能5分钟出现一次。周一我处理完数据库问题,披着劳累的心又来处理此问题。项目环境是lnmp,全部服务是阿里云的,数据库是阿里云RDS mysql,我检查服务器报错日志,查不到任何有意义的信息,最终报错信息在web的JS页面查出问题,报错显示:{"error":{"message":"An exception occured in driver: SQLSTATE[HY000] [2002] php_network_getaddresses: getaddrinfo failed: Name or service not known","code":0}} 通过此问题进行一步一步排查。
排查思路:通过报错信息得到的信息有两点 域名解析造成DNS问题 数据库层面问题 服务器vpc网络 数据库经典网络,网络类型不同引发的网络延迟
第一步:在测试环境复现此问题,让研发人员把测试库数据库连接地址改为线上库,查看测试环境并不会出现此问题
第二部:在生产上新配置一个站点,新解析一个域名,发现问题存在,排除域名问题。
第三部:数据库问题已经排除,域名问题已经排除,最后检查服务器问题。重启nginx php-fpm问题
最终解决!
此问题出现的原因:重启php-fpm后服务不会出现此问题,分析php-fpm进程有假死的状态,导致出现瞬间性的错误产生。
当时发生问题后,百度了一些文章,和我们出现的报错一样,仅供大家参考
https://help.aliyun.com/knowledge_detail/92120.html?spm=5176.11065259.1996646101.searchclickresult.38bf1fcdSKxZWB

出现问题,排查思路尤为重要。
排查思路,在日后的工作经验中望慢慢提升,加油!

原文地址:http://blog.51cto.com/lmy666/2310633

时间: 2024-10-09 15:05:00

线上网站网站报2002错误的相关文章

线上MYSQL同步报错故障处理总结(转)

前言 在发生故障切换后,经常遇到的问题就是同步报错,数据库很小的时候,dump完再导入很简单就处理好了,但线上的数据库都150G-200G,如果用单纯的这种方法,成本太高,故经过一段时间的摸索,总结了几种处理方法. 生产环境架构图 目前现网的架构,保存着两份数据,通过异步复制做的高可用集群,两台机器提供对外服务.在发生故障时,切换到slave上,并将其变成master,坏掉的机器反向同步新的master,在处理故障时,遇到最多的就是主从报错.下面是我收录下来的报错信息. 常见错误 最常见的3种情

linux下遇见mysql启动报2002错误解决办法

前言:目前问题解决了,但是仍不知道是什么原因造成的,在出现问题前安装uWSGI后,mysql就出现这个问题的,哪位大侠说说这是怎么回事? 正文:Linux 下 Mysql error 2002 错误解决 先查看 /etc/rc.d/init.d/mysqld status 查看mysql是否已经启动. 若mysql未启动,etc/init.d/mysqld start启动mysql 启动失败,八成是/etc/my.comf文件配置问题,然后mv /etc/my.cnf /tmp/my.cnf,再

网站访问报如下错误

Unable to make the session state request to the session state server. Please ensure that the ASP.NET State service is started and that the client and server ports are the same.  If the server is on a remote machine, please ensure that it accepts remo

Wordpress上传资源报HTTP错误

简述 在公司内部搭建内部视频学习网站,经过对比选择了wordpress进行站点搭建.但是在上传视频遭遇到了各种问题,特将此处理过程进行记录. 原因排查 1.上传一个十几兆mp4的文件上传进度到达百分之百,会媒体提示http错误 2.刚开始怀疑是PHP.Nginx的上传大小限制了.但是查看PHP.Nginx配置均配置了1000M vim /etc/nginx/conf.d/default.conf location / { root /data/web; index index.php index

HipChat上传文件报未知错误解决方案

前言 HipChat是Atlassian公司的一款团队协作即时通讯工具,服务端为Linux(官方给的服务端就是一个虚拟机),在Windows.Linux.Android.IOS.Mac等平台都有客户端软件,还可以直接在PC的Web上直接聊天,对于团队协作交流需求整理的比较到位,最主要的是HipChat可以和Confluence对接讨论主题(不是有Confluence的需求个人觉得不如其他一些团队通讯软件). 前些天接下了配置HipChat服务端的任务,但是使用了几天后发现,聊天时发送超过10M的

线上MYSQL同步报错故障处理方法总结

前言 在发生故障切换后,经常遇到的问题就是同步报错,下面是最近收集的报错信息. 记录删除失败 在master上删除一条记录,而slave上找不到 Last_SQL_Error: Could not execute Delete_rows event on table hcy.t1; Can't find record in 't1', Error_code: 1032; handler error HA_ERR_KEY_NOT_FOUND; the event's master log mysq

idea 内置tomcat jersey 跨服务器 上传文件报400错误

报错内容 com.sun.jersey.api.client.UniformInterfaceException: PUT http://.jpg returned a response status of 400 Bad Request 因为跨服务器上传文件,文件名中里面含有中文名称,所以报错,解决: 让文件服务器支持utf-8编码或者将文件名变成英文.(最好的就是根据时间加随机数 或者是UUID来命名) 简单版的jsersey上传 @RequestMapping("/fileupload3&

PHPStrom上传文件报502错误原因

PhpStorm是一个轻量级且便捷的PHP IDE,其自身拥有apache类似的编译器,能够在无Apache的情况下运行,很适合初学PHPStrom的朋友. 但是我发现了一个问题,那就是用PHPStrom进行上传操作时,就会导致PHPStrom自身的编译器崩溃,刚开始碰到这种问题一直以为是环境问题,为此还重装了一次系统.后来经过一次次的排除测试,发现不是环境问题的原因. 那怎么解决了,那就是不用PHPStrom这个IDE的编译器,用Apache的编译器就能够解决这个问题. 比如说PHPStrom

windows上pip install 报编码错误

报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0xb1 in position 34: ordinal not in range(128) 解决方式: 在python安装目录下Python26\Lib\site-packages新建一个文件,文件名为:sitecustomize.py 文件内容为: import sys sys.setdefaultencoding('utf-8') python会自动加载这个文件,进而更改编码. 进