sysstat工具可以监控系统的IO,CPU,SWAP,LOAD,NETWORK,DISK
安装后,系统会生成定时任务脚本
路径:/etc/cron.d/sysstat
内容:
# Run system activity accounting tool every 10 minutes
*/10 * * * * root /usr/lib64/sa/sa1 -S DISK 1 1
# 0 * * * * root /usr/lib64/sa/sa1 -S DISK 600 6 &
# Generate a daily summary of process accounting at 23:53
53 23 * * * root /usr/lib64/sa/sa2 -A
可以根据需要修改执行频率,测试机建议修改为1分钟
定时任务记录日志:/var/log/sa/
通过sar来查看日志:
用法: sar [ 选项 ] [ <时间间隔> [ <次数> ] ]
主选项和报告:
-b I/O 和传输速率信息状况
-B 分页状况
-d 块设备状况
-I { <中断> | SUM | ALL | XALL }
中断信息状况
-m 电源管理信息状况
-n { <关键词> [,...] | ALL }
网络统计信息
关键词可以是:
DEV 网卡
EDEV 网卡 (错误)
NFS NFS 客户端
NFSD NFS 服务器
SOCK Sockets (套接字) (v4)
IP IP 流 (v4)
EIP IP 流 (v4) (错误)
ICMP ICMP 流 (v4)
EICMP ICMP 流 (v4) (错误)
TCP TCP 流 (v4)
ETCP TCP 流 (v4) (错误)
UDP UDP 流 (v4)
SOCK6 Sockets (套接字) (v6)
IP6 IP 流 (v6)
EIP6 IP 流 (v6) (错误)
ICMP6 ICMP 流 (v6)
EICMP6 ICMP 流 (v6) (错误)
UDP6 UDP 流 (v6)
-q 队列长度和平均负载
-r 内存利用率
-R 内存状况
-S 交换空间利用率
-u [ ALL ]
CPU 利用率
-v Kernel table 状况
-w 任务创建与系统转换统计信息
-W 交换信息
-y TTY 设备状况
根据监控需要,通过不同的参数来获取不同的数据(CPU,IO,MEM,NETWORK,SWAP)
①,查看cpu利用率 sar -u -f sa31
10时15分01秒 CPU %user %nice %system %iowait %steal %idle
10时20分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
10时25分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
10时30分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
10时35分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
10时40分01秒 all 0.02 0.00 0.01 0.00 0.00 99.96
10时45分01秒 all 0.35 0.00 0.07 0.03 0.00 99.56
10时50分01秒 all 0.05 0.00 0.15 0.01 0.00 99.80
10时55分01秒 all 0.02 0.00 0.04 8.62 0.00 91.32
11时00分01秒 all 0.02 0.00 0.06 12.46 0.00 87.46
11时05分01秒 all 0.03 0.00 0.05 17.90 0.00 82.02
11时10分01秒 all 0.02 0.00 0.04 12.09 0.00 87.86
11时15分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
11时20分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
11时25分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
11时30分01秒 all 0.01 0.00 0.01 0.00 0.00 99.98
平均时间: all 0.01 0.00 0.01 0.38 0.00 99.60
从上面数据可以看出,系统目前cpu空闲率较高,说明cpu负载较低
②,IO sar -b -f sar31
10时15分01秒 tps rtps wtps bread/s bwrtn/s
10时20分01秒 0.46 0.00 0.46 0.00 3.60
10时25分01秒 0.39 0.00 0.39 0.00 3.20
10时30分01秒 0.45 0.00 0.45 0.00 3.73
10时35分01秒 0.32 0.00 0.32 0.00 2.67
10时40分01秒 4.85 0.00 4.85 0.00 57.63
10时45分01秒 50.40 1.28 49.12 23.46 602.82
10时50分01秒 1.41 0.83 0.58 44.04 4.53
10时55分01秒 586.78 586.35 0.43 18756.56 3.33
11时00分01秒 854.58 854.20 0.38 27334.42 3.09
11时05分01秒 851.33 850.89 0.44 27207.48 3.53
11时10分01秒 548.02 547.27 0.75 17512.20 6.62
11时15分01秒 0.31 0.00 0.31 0.00 2.51
11时20分01秒 0.67 0.00 0.67 0.00 5.20
11时25分01秒 0.40 0.00 0.40 0.00 3.20
11时30分01秒 0.53 0.08 0.45 0.64 3.60
11时35分01秒 0.41 0.00 0.41 0.00 3.33
平均时间: 22.83 21.67 1.16 703.72 13.10
从上面的数据可以看出,系统在10时55分01秒到11时10分01秒时发生了大量的读操作,可以通过这个信息点来定位原因。
③,memory sar -r -f sa31(内存利用率)
10时15分01秒 kbmemfree kbmemused %memused kbbuffers kbcached kbcommit %commit
10时20分01秒 13299252 2970424 18.26 273576 795852 6187972 17.79
10时25分01秒 13298540 2971136 18.26 273576 795856 6188184 17.79
10时30分01秒 13299040 2970636 18.26 273576 795864 6188184 17.79
10时35分01秒 13298820 2970856 18.26 273576 795868 6188184 17.79
10时40分01秒 13298864 2970812 18.26 273576 795872 6188184 17.79
10时45分01秒 13278872 2990804 18.38 273804 812100 6192980 17.80
10时50分01秒 5462464 10807212 66.43 173524 8698752 14301972 41.12
10时55分01秒 5405984 10863692 66.77 167796 8758092 14475136 41.61
11时00分01秒 5405516 10864160 66.78 167796 8758096 14475140 41.61
11时05分01秒 5405116 10864560 66.78 168292 8758476 14475440 41.62
11时10分01秒 5466204 10803472 66.40 168292 8699100 14301976 41.12
11时15分01秒 5466572 10803104 66.40 168292 8699104 14301976 41.12
11时20分01秒 5466360 10803316 66.40 168292 8699112 14301976 41.12
11时25分01秒 5466792 10802884 66.40 168292 8699116 14301976 41.12
11时30分01秒 5466412 10803264 66.40 168316 8699120 14301976 41.12
11时35分01秒 5466204 10803472 66.40 168316 8699132 14301976 41.12
11时40分01秒 5466756 10802920 66.40 168316 8699136 14301976 41.12
11时45分01秒 5466748 10802928 66.40 168316 8699140 14301976 41.12
11时50分01秒 5466748 10802928 66.40 168316 8699144 14301976 41.12
11时55分01秒 5466992 10802684 66.40 168316 8699152 14301976 41.12
12时00分01秒 5466988 10802688 66.40 168316 8699156 14301976 41.12
12时05分01秒 5450120 10819556 66.50 168316 8699160 14319668 41.17
12时10分02秒 5449484 10820192 66.51 168316 8699168 14319668 41.17
12时15分01秒 5449612 10820064 66.50 168316 8699176 14319668 41.17
平均时间: 11717222 4552454 27.98 250840 2393911 7895837 22.70
memused:表示内存使用率,commit:表示要保证程序的正常运行还需要的内存,如果memused+commit > 100则表示系统会出现数据页换入换出,导致内存抖动。
kbbuffers:表示缓存的数据块大小;kbcached:表示缓存的文件大小
④,NETWORK sar -n DEV -f sa31
12时05分01秒 IFACE rxpck/s txpck/s rxkB/s txkB/s rxcmp/s txcmp/s rxmcst/s
12时10分02秒 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
12时10分02秒 eth0 1.14 0.17 0.09 0.01 0.00 0.00 0.03
12时10分02秒 eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
12时15分01秒 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
12时15分01秒 eth0 1.20 0.17 0.10 0.01 0.00 0.00 0.05
12时15分01秒 eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
12时20分01秒 lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
12时20分01秒 eth0 1.74 1.27 0.15 0.14 0.00 0.00 0.02
12时20分01秒 eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
平均时间: lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
平均时间: eth0 0.64 0.26 0.11 0.04 0.00 0.00 0.03
平均时间: eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
上面数据展现了所有网卡的数据包接收和发送情况
sar -n NFS -f sa31 (错误数据包的情况)
10时15分01秒 call/s retrans/s read/s write/s access/s getatt/s
10时20分01秒 0.00 0.00 0.00 0.00 0.00 0.00
10时25分01秒 0.00 0.00 0.00 0.00 0.00 0.00
10时30分01秒 0.00 0.00 0.00 0.00 0.00 0.00
10时35分01秒 0.00 0.00 0.00 0.00 0.00 0.00
10时40分01秒 0.00 0.00 0.00 0.00 0.00 0.00
10时45分01秒 0.00 0.00 0.00 0.00 0.00 0.00
10时50分01秒 0.00 0.00 0.00 0.00 0.00 0.00
10时55分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时00分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时05分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时10分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时15分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时20分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时25分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时30分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时35分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时40分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时45分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时50分01秒 0.00 0.00 0.00 0.00 0.00 0.00
11时55分01秒 0.00 0.00 0.00 0.00 0.00 0.00
12时00分01秒 0.00 0.00 0.00 0.00 0.00 0.00
12时05分01秒 0.00 0.00 0.00 0.00 0.00 0.00
12时10分02秒 0.00 0.00 0.00 0.00 0.00 0.00
12时15分01秒 0.00 0.00 0.00 0.00 0.00 0.00
12时20分01秒 0.00 0.00 0.00 0.00 0.00 0.00
平均时间: 0.00 0.00 0.00 0.00 0.00 0.00
如果有错误数据包的出现,则需要引起重视,排查网卡运行状况
⑤,SWAP sar -S -f sa31
10时15分01秒 kbswpfree kbswpused %swpused kbswpcad %swpcad
10时20分01秒 18513912 0 0.00 0 0.00
10时25分01秒 18513912 0 0.00 0 0.00
10时30分01秒 18513912 0 0.00 0 0.00
10时35分01秒 18513912 0 0.00 0 0.00
10时40分01秒 18513912 0 0.00 0 0.00
10时45分01秒 18513912 0 0.00 0 0.00
10时50分01秒 18513912 0 0.00 0 0.00
10时55分01秒 18513912 0 0.00 0 0.00
11时00分01秒 18513912 0 0.00 0 0.00
11时05分01秒 18513912 0 0.00 0 0.00
11时10分01秒 18513912 0 0.00 0 0.00
11时15分01秒 18513912 0 0.00 0 0.00
11时20分01秒 18513912 0 0.00 0 0.00
11时25分01秒 18513912 0 0.00 0 0.00
11时30分01秒 18513912 0 0.00 0 0.00
11时35分01秒 18513912 0 0.00 0 0.00
11时40分01秒 18513912 0 0.00 0 0.00
11时45分01秒 18513912 0 0.00 0 0.00
11时50分01秒 18513912 0 0.00 0 0.00
11时55分01秒 18513912 0 0.00 0 0.00
12时00分01秒 18513912 0 0.00 0 0.00
12时05分01秒 18513912 0 0.00 0 0.00
12时10分02秒 18513912 0 0.00 0 0.00
12时15分01秒 18513912 0 0.00 0 0.00
12时20分01秒 18513912 0 0.00 0 0.00
12时25分01秒 18513912 0 0.00 0 0.00
平均时间: 18513912 0 0.00 0 0.00
上面信息展现了交换分区的情况,从上面数据看出,目前还没有出现因内存不足而导致数据页从内存换出到磁盘swap分区的情况,说明目前系统内存容量能够支持程序的运行。