云服务器 ECS Linux IO 占用高问题排查方法

https://help.aliyun.com/knowledge_detail/41224.html?spm=5176.7841174.2.19.uqC1as#使用 iostat 从系统纬度查看磁盘 IO 负载

IO 负载查看方法


使用 iostat 从系统纬度查看磁盘 IO 负载

可以通过 iostat 从系统维度查看 IO 负载情况。

iostat 并非常见 Linux 发行版本自带工具,其包含在 sysstat 软件包中,需要先通过 yum 或 apt-get 等方式进行安装后才能使用。 具体安装方法本文不再详述。

用法说明:

  1. 示例用法:iostat -d -k 2# -d 表示,显示设备(磁盘)使用状态。# -k 表示让某些使用 block 为单位的列强制使用 kB 为单位。# 2表示,数据显示每隔2秒刷新一次。示例输出:Linux 3.10.0-123.9.3.el7.x8664 (centos) 06/27/2016 _x86_64 (1 CPU)Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtnxvda 0.58 0.12 3.75 278001 8820028xvdb 0.00 0.00 0.00 740 0xvdc 0.00 0.00 0.00 1388 0xvde 0.00 0.00 0.00 2035 0xvdf 0.00 0.00 0.00 740 0

更多参数及返回结果说明,可以参阅 iostat 的 man 帮助。

使用 iotop 从进程纬度查看磁盘 IO 负载

也可以通过 iotop 从进程维度对系统内进程的 IO 使用情况进行排序。

iotop 也并非常见 Linux 发行版本自带工具,也需要先通过 yum 或 apt-get 等方式进行安装后才能使用。 具体安装方法本文不再详述。

用法说明:

直接使用指令 iotop 运行后,可以看到类似以下界面:

回显说明:

  • 默认情况下按照 IO 使用量倒序排序,可以用左右箭头操作排序的字段。
  • 按 r 切换排序方式。
  • 按 o 只显示有磁盘 IO 活动的进程。
  • 更多参数及返回结果说明,可以参阅 iotop 的 man 帮助。

操作案例


kjournald 进程占用 IO 资源高问题

  • 问题描述:
    使用 iotop 排查分析,发现 kjournald 进程占用了大量 IO 资源。
  • 处理办法:
    kjournald 进程是 ext3 文件系统进行 IO 数据操作的内核进程,?它会在向磁盘内写入和读取数据时占用 CPU 和 内存资源。
    该问题通常是由于 ext3 文件系统循环的写数据,导致 Journal size 不断增大,进而占满导致。
    可以通过 dumpe2fs 指令查看相应分区的 Journal size 配置情况,然后尝试调大该值,看问题是否缓解。查询方法如下所示:
    1. $ dumpe2fs /dev/xvda1 | grep Journaldumpe2fs 1.42.9 (28-Dec-2013)Journal inode: 8Journal backup: inode blocksJournal features: journal_incompat_revokeJournal size: 128MJournal length: 32768Journal sequence: 0x00010ffbJournal start: 10953
    [[email protected] ~]#  dumpe2fs /dev/sda1
    dumpe2fs 1.39 (29-May-2006)
    Filesystem volume name:   /boot
    Last mounted on:          <not available>
    Filesystem UUID:          62eed73c-4f24-4250-a69a-2643755cba8a
    Filesystem magic number:  0xEF53
    Filesystem revision #:    1 (dynamic)
    Filesystem features:      has_journal ext_attr resize_inode dir_index filetype needs_recovery sparse_super
    Default mount options:    user_xattr acl
    Filesystem state:         clean
    Errors behavior:          Continue
    Filesystem OS type:       Linux
    Inode count:              76304
    Block count:              305200
    Reserved block count:     15260
    Free blocks:              272556
    Free inodes:              76265
    First block:              1
    Block size:               1024
    Fragment size:            1024
    Reserved GDT blocks:      256
    Blocks per group:         8192
    Fragments per group:      8192
    Inodes per group:         2008
    Inode blocks per group:   251
    Filesystem created:       Mon Jun 29 17:30:27 2015
    Last mount time:          Mon Jul 18 22:44:31 2016
    Last write time:          Mon Jul 18 22:44:31 2016
    Mount count:              143
    Maximum mount count:      -1
    Last checked:             Mon Jun 29 17:30:27 2015
    Check interval:           0 (<none>)
    Reserved blocks uid:      0 (user root)
    Reserved blocks gid:      0 (group root)
    First inode:              11
    Inode size:               128
    Journal inode:            8
    Default directory hash:   tea
    Directory Hash Seed:      885973fc-263b-466d-8498-e427b59d511a
    Journal backup:           inode blocks
    Journal size:             8M
    。。。

通过 4K 对齐提高 IO 性能

可以通过如下脚本对磁盘进行格式化并自动配置 4K 对齐。

注意:运行此脚本会自动格式化所有数据盘磁盘。如果并非新购磁盘,请在操作前,务必确认已经完成相关磁盘上的数据备份。可以通过快照进行磁盘的备份,操作方法可以参阅创建快照

    1. 下载脚本 auto_fdisk.zip
    2. 解压 auto_fdisk.zip 后,将相应脚本上传到目标服务器。
    3. 通过 chmod +x 等指令,为脚本添加执行权限。
    4. 以root身份,通过如下方式为脚本添加执行权限,然后运行即可:
      1. chmod +x ./auto_fdisk.sh./auto_fdisk.sh
时间: 2025-01-03 19:30:15

云服务器 ECS Linux IO 占用高问题排查方法的相关文章

云服务器 ECS Linux 系统 CPU 占用率较高问题排查思路

https://help.aliyun.com/knowledge_detail/41225.html?spm=5176.7841174.2.2.ifP9Sc 注意:本文相关配置及说明已在 CentOS 6.5 64 位操作系统中进行过测试.其它类型及版本操作系统配置可能有所差异,具体情况请参阅相应操作系统官方文档. 如果云服务器 ECS Linux 系统的 CPU 持续跑高,则会对系统稳定性和业务运行造成影响.本文对 CPU 占用率较高问题的排查分析做简要说明. CPU 负载查看方法 使用 v

云服务器 ECS Linux 磁盘空间满(含 innode 满)问题排查方法

问题描述 在云服务器 ECS Linux 系统内创建文件时,出现类似如下空间不足提示: No space left on device … 问题原因 导致该问题的可能原因包括: 磁盘分区空间使用率达到百分之百. 磁盘分区 inode 使用率达到百分之百. 僵尸文件:已删除文件因句柄被占用未释放导致相应空间未释放. 处理办法 要解决该问题,建议通过如下方式处理: 分区容量满 inode 容量满 修改 inode 数量 僵尸文件分析删除 分区容量满 登陆 SSH,使用 df -h 查看使用率,mou

云服务器 ECS Linux 系统添加“回收站”

删除是危险系数很高的操作,一旦误删可能会造成难以估计的损失.在云服务器 ECS Linux 系统中这种危险尤为明显.比如,一条简单的语句:rm –rf /* 就会把整个系统全部删除,而 Linux 并不会因为这条语句的不合理而拒绝执行. 在 Windows 中,为了防止误删,系统默认提供了回收站功能.用户在执行删除操作后,文件并不会直接从硬盘中删除,而是被放到回收站中.在清空回收站前,如果发现有文件被误删,用户可以将回收站中的文件恢复到原来的位置.而 Linux 并没有提供类似功能,删除命令 r

云服务器 ECS Linux 服务器修改时区的两种方式

在云服务器 ECS Linux 系统中,以 Centos6.5 为例,可以通过如下两种方式,修改系统时区: 可以使用命令 tzselect,修改时区.操作示例: [[email protected] ~]# tzselect Please identify a location so that time zone rules can be set correctly. Please select a continent or ocean. 1) Africa 2) Americas 3) Ant

云服务器 ECS Linux 修改编码格式

https://help.aliyun.com/knowledge_detail/41424.html?spm=5176.7841174.2.19.Le8kvy 通常情况下,云服务器 ECS Linux 默认的编码格式是 utf-8.而安装有些软件可能需要 GBK 等编码支持.本文以 CentOs 6.5 系统为例,建议介绍修改系统编码格式为 zh_CN.GBK 的方法. 方法一 1.vim /etc/profile.d/chinese.sh 2.写入以下内容 export LC_ALL=zh_

云服务器 ECS Linux 误删除文件恢复方法介绍

云服务器 ECS Linux 下,rm -rf  意味着一旦删除的文件是无法挽回的.但如果在没有文件覆盖操作的前提下,可以先尝试相关方式进行文件恢复. 本文对此进行简要说明. https://help.aliyun.com/knowledge_detail/41197.html?spm=5176.7841174.2.6.uqC1as 通过 extundelete 尝试数据恢复 说明: 下文以 CentOS 6.5 ext4 文件系统为实验环境,工具为 extundelete. 在实际线上恢复过程

云服务器 ECS Linux 系统盘数据转移方法

转自:https://help.aliyun.com/knowledge_detail/41400.html 问题描述 购买云服务器 ECS Linux 服务器时,未购买数据盘,使用一段时间后,随着业务增加,现有系统盘已无法满足业务需求.执行 df -h 查询空间使用率接近 100%,需要将数据转移至新购买的数据盘. 处理办法 针对此类情况,可参考以下思路进行解决. 注:涉及数据操作,操作前请注意通过快照等手段进行备份. 1. 购买数据盘,创建好分区后,在系统内挂载数据盘到 /mnt/shuju

云服务器 ECS Linux 系统中常见的日志文件介绍

云服务器 ECS Linux 系统中,日志文件是非常重要的文件,它们记录了很多系统中重要的事.Linux 系统中常见日志文件概述如下: /var/log/cron可以在 cron 文件中检查 crontab 任务调度是否实际执行,执行过程是否发生错误,以及 /etc/crontab 文件是否有语法错误或编写错误. /var/log/dmesg 可以在 dmesg 文件中检查系统在开机时候内核检测过程所产生的各项信息,包括系统的设备信息,以及在启动和操作过程中系统记录的任何错误和问题的信息.通过

云服务器 ECS Linux 系统下使用 dig 命令查询域名解析

云服务器 ECS Linux 系统可以使用通常自带的 dig 命令来查询域名解析情况.本文对此进行简要说明. 查询域名 A 记录 命令格式: dig <域名> 比如,查询域名 www.aliyun.com 的解析情况: $ dig www.aliyun.com ; <<>> DiG 9.8.2rc1-RedHat-9.8.2-0.37.rc1.el6_7.7 <<>> www.aliyun.com ;; global options: +cmd