网站故障排查几个简单步骤

1、top命令查看cpu消耗多少(id%的值和%cpu要是一直是几百就是问题了。%wa要是大于30%也是压力大了)。还有看负载的3个值(和cpu线程是1比1关系。要是值大于线程书,那么也是压力过大。)

top命令要是发现cpu消耗过多,可以知道是哪几个进程了。

2、查看硬盘使用情况。有时候监控不好可能会被日志文件撑死。df -h (即时清理无用的,否则一满什么问题都会出现)

3、查看内存使用情况。free -m

4、

查看12.6% wa

IO等待所占用的CPU时间的百分比,高过30%时IO压力高

用iostat -x 1 10

如果 iostat 没有,要  yum install sysstat

查看%util 100.10 %idle 66.2

如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。

dle小于70% IO压力就较大了,一般读取速度有较多的wait.

5、通过上面几种方式,查找到暂用服务器资源的程序,通过日志排错

时间: 2024-10-10 04:21:33

网站故障排查几个简单步骤的相关文章

网站故障-排查步骤

作为一家中型网站的运维工程师,真实遇到网站GG了,寻求理想排查步骤,自己心得,附加网友观点 网站挂了, 1.ping我的网站主站IP,可能是禁ping,不通,可能是机房网络问题,那么就去ping机房的网关! 2.机房网络如果没问题的话,那我会去看访问是什么情况,服务器异常或者是nginx报错的话, 那我     会排查一下硬件,我的网站是用简单的nginx负载+对外防火墙的,那我就看看access.log, 统计一下这阶段可疑IP以及行为,如果有攻击,先拉黑可疑黑名单 3.tracert,我会看

一个网站故障排查的、代码更新的简便脚本

故障排错脚本 由于近来公司的服务器经常会出点小问题,基于各种原因要去排错.这里我用python写了一个脚本,主要四调用os模块操作.有一个是要统计mysql最大连接数的.因为好像python不支持"show processlist",所以自己写了一个模块mysqlconn.py.放在/python目录下.这个模块的作用主要是执行"sh /python/mysqlconn.sh".这个脚本.然后脚本会生成一个叫mysqlconn.txt文件放到:/python/mys

CentOS服务器上搭建Gitlab安装步骤、中文汉化详细步骤、日常管理以及异常故障排查

一, 服务器快速搭建gitlab方法 可以参考gitlab中文社区 的教程 centos7安装gitlab:https://www.gitlab.cc/downloads/#centos7 centos6安装gitlab:https://www.gitlab.cc/downloads/#centos6 如下方法按照官网来操作,手工安装过于麻烦.当前测试平台为小鸟云的三个月centos 7测试机. 1. 安装配置依赖项 如想使用Postfix来发送邮件,在安装期间请选择'Internet Site

SQL Server 2008性能故障排查(二)——CPU

原文:SQL Server 2008性能故障排查(二)--CPU 承接上一篇:SQL Server 2008性能故障排查(一)--概论 说明一下,CSDN的博客编辑非常不人性化,我在word里面都排好了版,贴上来就乱得不成样了.建议CSDN改进这部分.也请大家关注内容不要关注排版.同时在翻译的过程中本人也整理了一次思路,所以还似乎非常愿意翻译,虽然有点自娱自乐,但是分享给大家也是件好事 CPU 瓶颈: CPU瓶颈可能因为某个负载所需的硬件资源不足而引起.但是过多的CPU使用通常可以通过查询优化(

Linux运维常见故障排查和处理的33个技巧汇总

作为linux运维,多多少少会碰见这样那样的问题或故障,从中总结经验,查找问题,汇总并分析故障的原因,这是一个Linux运维工程师良好的习惯.每一次技术的突破,都经历着苦闷,伴随着快乐,可我们还是执着的继续努力,从中也积累了更多的经验,这就是实践给予我们的丰厚回报. 下面汇总了我做项目过程可能出现的故障及解决方法,看看是否与你有共鸣,并对你有帮助? 第一:常见问题解决集锦   1.shell脚本不执行    问题:某天研发某同事找我说帮他看看他写的shell脚本,死活不执行,报错.我看了下,脚本

跟我学-域名解析故障排查技巧

天苍苍,野茫茫,网站一瘫,唯有泪两行!!客户跳,老板叫,解析故障,心惊又肉跳!! 对企业网站来说,很怕出现网站打不开的情况,一旦发生,准会发现公司技术部呈现一片哀嚎景象.为了让运维的难兄难弟们做个精致的小白领,小编特别为你们总结了一套<域名解析故障排查技巧实操全网最全手册>,并分为“初阶版”“进阶版”,跟我学完保您在排查解析故障方面,脑回路神清晰,分分钟就能定位问题.为了助您减少客户不可用时间,并赢得老板信任,今天就来听听小编跟大家唠唠域名解析那点事儿. 因为DNS是互联网流量的入口,所以企业

自己建网站的五大简单步骤

建设一个网站有哪些简单的步骤呢?下面我们就一起来分享一下. 第一.为网站申请一个域名.这一个步骤如果要从技术角度来说的话,域名就是互联网中一个解决对应关系的方法.因为域名在互联网中的传播非常广,而且也是比较普及的,因此域名的使用也变得有广泛文化以及社会意义.而域名被称为企业的互联网商标,或者是互联网上的门牌号.很多企业在网站建设选择域名的时候,基本都想要注册免费域名,最重要的是域名与自己的企业商标一样.因为所注册的域名如果与商标一样的话,注册之后就拥有了专属权,并且受到法律的保护.但是域名注册是

云计算之路-阿里云上-寒流来袭:2014年12月23日21:45-23:15网站故障

1个多小时间的网站故障给大家带来很大的麻烦,在这里我们表示深深的歉意!希望大家能够谅解! 这两天上海的气温在回升,而杭州的云上却突然袭来一股寒流. 12月23日晚上,阿里云进行了一次RDS的发布,在这次发布中自动地修改了我们的数据库连接数限制,谁也不知道,然后... 21:45:52左右开始,日志中出现大量执行时间超过5秒的请求. 然后出现超过10秒.20秒...甚至超过100秒的请求. 21:46:50左右,开始出现数据库连接错误: System.Data.SqlClient.SqlExcep

Kubernetes之kubectl常用命令使用指南:2:故障排查

kubectl是一个用于操作kubernetes集群的命令行接口,通过利用kubectl的各种命令可以实现各种功能,是在使用kubernetes中非常常用的工具.这里我们会通过一些简单的实例来展现其中一些高频命令的使用方法. 更为重要的是这些命令使用的场景以及能够解决什么样的问题.上篇文章我们介绍了创建和删除相关的几条命令,这篇文章我们来看一下出现问题时最常用的另外九条命令. 常用命令 kubectl故障排查相关,本文将会简单介绍一下如下命令 项番 命令 说明 No.1 version 显示客户