CPU、内存、IO负载过高排障方法及解决方案

内存使用过高处理方法:

查询手段

使用top查看,

处理方法

1、将没有用的进程杀掉

2、查看占用进程高的应用的日志,对其做相应用的优化

3、增加内存

或者通过pstack这些工具去查对应进程的pid对系统调用的情况来定位故障原因。

CPU负载过高处理方法:

查询手段:
CPU资源负载过高,可通过使用top命令查出对应cpu资源使用率高的进程,

分析原因:

根据进程判断是什么应用,再去查对应应用的访问量大小,以及日志去定位是因为访问量过大导致,还是因为性能的原因导致。

处理方法:

如果是访问量导致的,那就要考虑服务器扩容,通过lvs做服务的负载均衡来分担了。
如果是性能的问题,通常通过日志可以查到慢查询的代码的。将慢查询的日志整理给到开发,让开发去做优化就可以了。

IO负载过高处理方法

查询手段:
IO过高,可通过iostat与iotop去检查,iotop可以查到哪个进程的IO比较高的。也用同样的方法去查原因。

分析原因:

IO比较高通常出现在数据库或写的日志量非常大,或应用访问量非常大而产生大量的日志写磁盘的原因导致的。

处理方法:
因为读写数据库导致IO过高,通常是慢查询导致的,可以查mysql的慢查询的命令,让开发去做优化。
如果是web访问量过大而导致大量写日志的,可以考虑暂时将日志关闭,或优化日志,将部分对查障没有帮助的日志采用屏蔽的方法减低日志写入磁盘的量的方法减小IO。

比如有些开发可能会对php或tomcat或resin开debug的,这种日志可以关闭掉的。nginx的日志格式也可以调的,可以屏蔽掉部分关键字的日志输出的。

时间: 2024-08-25 12:12:32

CPU、内存、IO负载过高排障方法及解决方案的相关文章

IO负载高的来源定位 IO系列

http://elf8848.iteye.com/category/281637 前言: 在一般运维工作中经常会遇到这么一个场景,服务器的IO负载很高(iostat中的util),但是无法快速的定位到IO负载的来源进程和来源文件导致无法进行相应的策略来解决问题. 这个现象在MySQL上更为常见,在5.6(performance_schema提供io instrument)之前,我们通常只能猜到是MySQL导致的高IO,但是没法定位具体是哪个文件带来的负载. 例如是ibdata的刷写?还是冷门ib

IO负载高的来源定位

前言: 在一般运维工作中经常会遇到这么一个场景,服务器的IO负载很高(iostat中的util),但是无法快速的定位到IO负载的来源进程和来源文件导致无法进行相应的策略来解决问题. 这个现象在MySQL上更为常见,在5.6(performance_schema提供io instrument)之前,我们通常只能猜到是MySQL导致的高IO,但是没法定位具体是哪个文件带来的负载. 例如是ibdata的刷写?还是冷门ibd的随机读取? 本文就将介绍一个比较简单的定位IO高负载的流程. 工具准备: io

iotop,pt-ioprofile : mysql IO负载高的来源定位

http://www.cnblogs.com/cenalulu/archive/2013/04/12/3016714.html 前言: 在一般运维工作中经常会遇到这么一个场景,服务器的IO负载很高(iostat中的util),但是无法快速的定位到IO负载的来源进程和来源文件导致无法进行相应的策略来解决问题. 这个现象在MySQL上更为常见,在5.6(performance_schema提供io instrument)之前,我们通常只能猜到是MySQL导致的高IO,但是没法定位具体是哪个文件带来的

VPS性能测试:CPU内存,硬盘IO读写,带宽速度,UnixBench和压力测试

现在便宜的VPS主机越来越多了,一些美国的VPS主机甚至给出1美元一月的VPS,堪比虚拟主机还要便宜,巨大的价格优势吸引不少人购买和使用,而近些年来国内的主机商也开始意识到便宜的VPS对草根站长的诱惑力,纷纷推出了低价VPS,其中突出的代表就是阿里云. 所谓“一分钱一分货”,把VPS当成虚拟主机来卖的如果不是做慈善事业就是超售严重,买回来的VPS到底值不值这个价钱,我们一般需要对VPS主机进行一番性能测试,涉及的项目主要有CPU内存,硬盘IO读写,带宽速度,UnixBench和压力测试等等. 本

linux CPU使用率过高或负载过高的处理思路

1.查看系统CPU负载及使用率的命令为:top    vmstat top 命令:查看进程级别的cpu使用情况. vmstat 命令:查看系统级别的cpu使用情况. 下面通过具体的图例来分析: 1.1  top 命令可以查看进程的CPU.内存等资源的使用情况.       在top命令运行过程中可以通过top的内部命令做显示方式的控制. 1- 开启或关闭显示所有cpu使用详细情况 l - 关闭或开启第一部分第一行 top 信息的表示 t - 关闭或开启第一部分第二行 Tasks 和第三行 Cpu

cpu使用率低负载高,原因分析

原因总结 产生的原因一句话总结就是:等待磁盘I/O完成的进程过多,导致进程队列长度过大,但是cpu运行的进程却很少,这样就体现到负载过大了,cpu使用率低. 下面内容是具体的原理分析:在分析负载为什么高之前先介绍下什么是负载.多任务操作系统.进程调度等相关概念. 什么是负载 什么是负载:负载就是cpu在一段时间内正在处理以及等待cpu处理的进程数之和的统计信息,也就是cpu使用队列的长度统计信息,这个数字越小越好(如果超过CPU核心*0.7就是不正常) 负载分为两大部分:CPU负载.IO负载 例

    排障思路--------杀毒

一.尽可能搞清楚问题的前因后果 不要一下子就扎到服务器前面,你需要先搞明白对这台服务器有多少已知的情况,还有故障的具体情况.不然你很可能就是在无的放矢. 必须搞清楚的问题有: 故障的表现是什么?无响应?报错? 故障是什么时候发现的? 故障是否可重现? 有没有出现的规律(比如每小时出现一次) 最后一次对整个平台进行更新的内容是什么(代码.服务器等)? 故障影响的特定用户群是什么样的(已登录的, 退出的, 某个地域的-)? 基础架构(物理的.逻辑的)的文档是否能找到? 是否有监控平台可用? (比如M

linux cpu和IO优化

系统优化是一项复杂.繁琐.长期的工作,优化前需要监测.采集.测试.评估,优化后也需要测试.采集.评估.监测,而且是一个长期和持续的过程,不 是说现在优化了,测试了,以后就可以一劳永逸了,也不是说书本上的优化就适合眼下正在运行的系统,不同的系统.不同的硬件.不同的应用优化的重点也不同. 优化的方法也不同.优化的参数也不同.性能监测是系统优化过程中重要的一环,如果没有监测.不清楚性能瓶颈在哪里,怎么优化呢?所以找到性能 瓶颈是性能监测的目的,也是系统优化的关键.系统由若干子系统构成,通常修改一个子系

云服务器 ECS Linux IO 占用高问题排查方法

https://help.aliyun.com/knowledge_detail/41224.html?spm=5176.7841174.2.19.uqC1as#使用 iostat 从系统纬度查看磁盘 IO 负载 IO 负载查看方法 使用 iostat 从系统纬度查看磁盘 IO 负载 使用 iotop 从进程纬度查看磁盘 IO 负载 使用 iostat 从系统纬度查看磁盘 IO 负载 可以通过 iostat 从系统维度查看 IO 负载情况. iostat 并非常见 Linux 发行版本自带工具,