sar性能监控

 1、安装sar:

  yum -y install sysstat

  第一次使用sar命令会提示如下错误:“无法打开 /var/log/sa/sa13: 没有那个文件或目录”。

  

  这里的值13是当天的日期,如今天是2017-02-13,所以这里提示13。原因是没有生成这个文件,可以使用-o命令生成。

  

  生成成功

  

2、监控CPU

  

  sar -u 2 3  #每2秒采集一次,共采集3次

  sar -u 2  -e 12:50:00 > /tmp/cpu.log  #每2秒采集一次,直到12点50分,数据将保存到/tmp/cpu.log文件中

  %usr:用户进程消耗的CPU时间百分比。

  %nice: 运行正常进程消耗的CPU时间百分比。

  %system:系统进程消耗的CPU时间百分比。

  %iowait:I/O等待所占CPU时间百分比。

  %steal:在内存紧张环境下,pagein强制对不同的页面进行的steal操作。

  %idle:CPU空闲状态的时间百分比。

  在所有的显示中,我们应主要注意%iowait和%idle,%iowait的值过高,表示硬盘存在I/O瓶颈,%idle值高,表示CPU较空闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对较低,表明系统中最需要解决的资源是CPU。

3、内存监控

  

  Kbmemfree:这个值和free命令中的free值基本一致,所以它不包括buffer和cache的空间。

  kbmemused:这个值和free命令中的used值基本一致,所以它包括buffer和cache的空间。

  %memused:这个值是kbmemused和内存总量(不包括swap)的一个百分比。

  kbbuffers和kbcached:这两个值就是free命令中的buffer和cache。

  kbcommit:保证当前系统所需要的内存,即为了确保不溢出而需要的内存(RAM+swap)。

  %commit:这个值是kbcommit与内存总量(包括swap)的一个百分比。

4、内存分页监控

  

  pgpgin/s:表示每秒从磁盘或SWAP置换到内存的字节数(KB)。

  pgpgout/s:表示每秒从内存置换到磁盘或SWAP的字节数(KB)。

  fault/s:每秒钟系统产生的缺页数,即主缺页与次缺页之和(major + minor)。

  majflt/s:每秒钟产生的主缺页数。

5、磁盘I/O监控

  

  tps:每秒钟物理设备的I/O 传输总量。

  rtps:每秒钟从物理设备读入的数据总量。

  wtps:每秒钟向物理设备写入的数据总量。

  bread/s:每秒钟从物理设备读入的数据量,单位为块/s。

  bwrtn/s:每秒钟向物理设备写入的数据量,单位为块/s。

6、进程队列长度和负载监控

  

  runq-sz:运行队列的长度(等待运行的进程数)。

  plist-sz:进程列表中进程(processes)和线程(threads)的数量。

  ldavg-1:最后1分钟的系统平均负载(System load average)。

  ldavg-5:过去5分钟的系统平均负载。

  ldavg-15:过去15分钟的系统平均负载。

7、系统交换活动信息监控

  

  pswpin/s:每秒系统换入的交换页面(swap page)数量。

  pswpout/s:每秒系统换出的交换页面(swap page)数量。

8、设备使用情况监控

  

  tps:每秒从物理磁盘I/O的次数.多个逻辑请求会被合并为一个I/O磁盘请求,一次传输的大小是不确定的。

  rd_sec/s:每秒读扇区的次数。

  wr_sec/s:每秒写扇区的次数。

  avgrq-sz:平均每次设备I/O操作的数据大小(扇区)。

  avgqu-sz:磁盘请求队列的平均长度。

  await:从请求磁盘操作到系统完成处理,每次请求的平均消耗时间,包括请求队列等待时间,单位是毫秒(1秒=1000毫秒)。

  svctm:系统处理每次请求的平均时间,不包括在请求队列中消耗的时间。

  %util:I/O请求占CPU的百分比,比率越大,说明越饱和。

  1. avgqu-sz的值较低时,设备的利用率较高。

  2. 当%util的值接近1% 时,表示设备带宽已经占满。

9、监控网卡流量

  

  sar -n DEV  -f /var/log/sa/sa13  #查看某一天的流量历史,后面跟文件名

  

10、命令用法

  -A:所有报告的总和。-u:CPU利用率-v:进程、节点、文件和锁表状态。
  -p:像是当前系统中指定CPU使用信息。-d:硬盘使用报告。-r:显示系统内存的使用情况。
  -n:显示网络运行状态。参数后面可跟DEV、EDEV、SOCK和FULL。DEV显示网络接口信息,EDEV显示网络错误的统计数据,SOCK显示套接字信息,FULL显示前三参数所以信息。
  -q:显示运行队列的大小,它与系统当时的平均负载相同
  -B:内存分页情况
  -R:显示进程在采样时间内的活动情况。

  -g:串口I/O的情况。

  -b:缓冲区使用情况。 

  -a:文件读写情况。

  -c:系统调用情况。 

  -R:进程的活动情况。

  -y:终端设备活动情况。

  -W:系统交换活动。

11、分析

  要判断系统瓶颈问题,有时需几个sar命令选项结合起来

  ?怀疑CPU存在瓶颈,可用sar-u 和sar-q 等来查看

  ?怀疑内存存在瓶颈,可用sar-B、sar-r 和sar-W 等来查看

  ?怀疑I/O存在瓶颈,可用sar-b、sar-u 和sar-d 等来查看

时间: 2024-10-29 19:06:04

sar性能监控的相关文章

vmstat和iostat命令进行Linux性能监控

这是我们正在进行的Linux命令和性能监控系列的一部分.vmstat和iostat两个命令都适用于所有主要的类unix系统(Linux/unix/FreeBSD/Solaris). 如果vmstat和iostat命令在你的系统中不可用,请安装sysstat软件包.vmstat,sar和iostat命令都包含在sysstat(系统监控工具)软件包中.iostat命令生成CPU和所有设备的统计信息.你可以从这个连接中下载源代码包编译安装sysstat,但是我们建议通过YUM命令进行安装. 在Linu

Linux上性能异常定位以及性能监控

引言:大多数的服务都是跑在Linux上的,Linux现在也已经到了一个很广泛的应用,但是仍然会有很多问题出现,我们就来讨论下我们性能监控的指标,性能监控无非就是从I/O,内存,CPU,TCP连接数,网络,进程或者线程来出发,使用到的命令有iostat,vmstat,sar,mpstat,netstat,ss,iftop,free,pstree/ps,pidstat,top,(uptime)下面来进一步深入下吧. 一,磁盘I/O(iostat) 我们的机器上有很多的数据是存储在磁盘上的,我们读取的

Sysstat性能监控工具包中20个实用命令

Sysstat性能监控工具包中20个实用命令 学习mpstat, pidstat, iostat和sar等工具,这些工具可以帮组我们找出系统中的问题.这些工具都包含了不同的选项,这意味着你可以根据不同的工作使用不同的选项,或者根据你的需求来自定义脚本.我们都知道,系统管理员都会有点懒,他们经常去寻找一些更简单的方法来完成他们的工作. mpstat – 处理器统计信息 1.不带任何参数的使用mpstat命令将会输出所有CPU的平均统计信息 1 2 3 4 5 6 [email protected]

进程管理,及性能监控 ps, pstree, pidof, top, htop, pmap, vmstat, dstat

进程的分类:    CPU-Bound: CPU密集型    I/O-Bound: I/O密集型 进程的分类:    批处理进程    交互式进程    实时进程 进程调度器:    进程优先级:0-139        实时优先级:1-99,数字越大,优先级越高        静态优先级:100-139, nice值调整,数字越大,优先级越低            nice:     -20, 19            priority: 100, 139        动态优先级:由内核维

linux Centos下搭建性能监控Spotlight on Unix

公司要做压力测试,有Linux服务器一台,系统Centos6.5,为了直观的展示系统性能,更好的去分析服务器,故要搭建一个监控.闲言休讲,直奔主题. 首先,Linux服务器一台:系统Centos6.5 其次,在我的笔记本上安装监控软件客户端 软件下载地址链接: 链接:http://pan.baidu.com/s/14Vwlw     密码:tmw4 配置spotlight登陆用户,注意spotlight默认不能使用root用户进行连接,需要用户自己创建一个具有root权限的用户.具体方法新建账号

Linux性能监控

Linux性能监控的目的是找到系统的瓶颈,并且调节系统来设法消除这些瓶颈.我们在监控性能的时候重点在于监视一下子系统: 1.CPU 2.MEMORY 3.IO 4.NETWORK 但这些系统都是彼此依赖,不能单独只看其中一个.当一个系统负载过重时往往会引起其它子系统的问题,比如说:       ->大量的读入内存的IO请求(page-in IO)会用完内存队列:        ->大量的网络流量会造成CPU的过载:        ->CPU的高使用率可能正在处理空闲内存队列:      

Linux性能监控与分析之

Linux性能监控与分析之---CPU CPU性能指标 1. 用户进程使用CPU的比率 2. 系统进程使用CPU的比率 3. WIO, 等待I/O 而是CPU处于空闲状态的比率. 4. CPU的空闲率 5. CPU用于上下文交换的比率 6,nice 7,real-time 8,运行进程队列的长度 9,平均负载 Linux下常用监控CPU性能的工具有 1. iostat  www.ahlinux.com 只能查看所有CPU的平均信息 2. vmstat 能查看所有CPU的平均信息, 能查看CPU队

Linux系统和性能监控之CPU篇

Linux系统和性能监控之CPU篇 性能优化就是找到系统处理中的瓶颈以及去除这些的过程.本文由sanotes.net站长tonnyom在2009年8月翻译自Linux System and Performance Monitoring系列文章.本文是系列的第一篇,讲述CPU方面的性能监控. 作者:tonnyom来源:sanotes.net|2010-12-24 13:25 移动端 收藏 分享 CTO训练营 | 12月3-5日,深圳,是时候成为优秀的技术管理者了 编者注:本文由sanotes.ne

Linux性能监控分析命令(五)—free命令介绍

性能监控分析的命令包括如下:1.vmstat2.sar3.iostat4.top5.free6.uptime7.netstat8.ps9.strace10.lsof 命令介绍:free命令是监控Linux内存使用最常用的命令语法格式: free [options] 参数说明: -m:以M为单位查看内容使用情况(默认为kb) -b:以字节为单位查看内存使用情况 -s:可以在指定时间段内不间断监控内存使用情况 -k:以KB为单位显示内存使用情况 -g:以GB为单位显示内存使用情况 -o:不显示缓冲区