Linux监控实战-2

vmstat命令

用法:vmstat 1 --->每个1s打印信息;

作用:

  • r:表示运行队列,如果改值过大,CPU可能会比较忙,使用率高;
  • b:阻塞并等待IO的进程数
  • swpd虚拟内存使用情况
  • free空闲的内存
  • buff被用来作为高速缓存
  • si(从磁盘分页到内存的数量)、so(从内存分页到磁盘的数量)两列,表示内存交换频繁程度,如果数值长期很大,表示内存不够;
  • bi读磁盘
  • bo写磁盘

Linux内存管理机制

  • Linux有自己的内存管理机制,Linux会尽可能的使用内存来提升IO效率;
  • 如果系统的free不够用,达到触发机制后,系统会自动释放cache和buffer的内存供程序使用(cache和bugffer是由内核进行动态管理的)
  • 如果used很多,而cache和buffer所占比率很小,那说明可能内存不够用了。不能单看free的大小来判断。所以你可以简单理解为cache和buffer也是free的一部分。(可用memory=free memory+buggers+cached)
  • swan是在磁盘上开辟的虚拟内存,所以他的变化有可能导致与IO的交换也会增加;

内存不足的表现:

free memory急剧减少,回收buffer和cache也无济于事,大量使用交换分区(swpd),读写磁盘数量(IO)增多,大量CPU时间用于等待IO(wa)。

   建议:memory测试期间保证内存充足,可用内存不少于20%;

好的状态:s0 si趋于0

IO的瓶颈:

IO的瓶颈是现在系统常见的问题,还没有得到良好的解决方案,而且发展也不如CPU和MEM快

好:  iowait % < 20%

一般: iowait % = 35%

糟糕:iowait  % >=50%

以上数值仅供参考

CPU>wa 过大(参考值,超过20);

system>bi&bo过大(参考值,超过2000)

命令使用场景:

  vmstat监控如果US很高,将近100%,就需要使用top命名来看是哪个进程导致,然后在分析进程;

sy很高,可以尝试strace来看系统内核调用情况;

如果io异常,可以尝试使用iostat来看看

iostat(简单了解)

   单独执行iostat,显示的结果为从系统开机到当前执行时刻的统计信息;

avg-cpu:总体cpu使用情况统计信息,对于多核cpu,这里为所有cpu的平均值;

Device:各磁盘失败的IO统计信息

tps:  每秒IO次数

kB_read/s:每秒从失败(drive expressed)读取的数据量

kB_wrtn/s:每秒向失败(drive expressed)写入的数据量

kB_read:读取的总数据量

kB_wrtn: 写入的总数据量

iostat -k 5 2

共执行2次,间隔5秒;和 iostat一样(iostat持续打印)

iostat -x 显示更加详细信息 【重点】

rrqm/s:每秒这个设备相关的读取请求有多少被合并(请求相同Block时,请求合并)

wrqm/s:每秒这个设备相关的写入请求有多少被合并;

r/s:每秒读取请求数(rio)

w/s:每秒写入请求数(wio)

resc/s:每秒写扇区数(wsect)

rkB/s:每秒读取的数据量,单位K字节;

avgqu-sz:平均I/O队列长度

await:平均每次设备I/O操作的等待时间(毫秒)

svctm:平均每次设备I/O操作的服务时间(毫秒)svctm越接近于await则说明等待时间少

%util:表示了设备繁忙程度,80%表示设备已经很忙了;

IO瓶颈的症状:

1、%util很高

2、await远大于svctm

3、avgqu-sz 比较大

时间: 2024-08-06 20:08:42

Linux监控实战-2的相关文章

百度网络监控实战:NetRadar横空出世(上)

原文:https://mp.weixin.qq.com/s/VBShicsqReDtureKAdEgDA 转自订阅号「AIOps智能运维」,已授权运维帮转发 作者简介:运小贝,百度高级研发工程师 负责百度内网质量监测平台(NetRadar)的业务端设计及开发工作.在系统和网络监控.时序指标异常检测.智能客服机器人等方向有广泛实践经验. 干货概览 百度内网连接着数十万台服务器,承载着全公司业务的网络通信,其通信质量的重要性不言而喻.而百度内网的质量监测平台NetRadar(网络雷达),通过对整个内

监控实战Prometheus+Grafana

这期的分享是监控实战,其实不想写这篇的,因为网上相关的文章也挺多的,但是出于光说不练都是假把式,而且也想告诉你:当帅气的普罗米修斯(Prometheus)遇到高颜值的格拉法纳(Grafana)究竟会擦出什么样的火花?所以忍不住还是想分享啊. 为了实战,我们再次请出架构图,请注意图中红色圈 1 的部分,主要分两条线去实战. 第一条战线:Prometheus 如何监控机器? 采用标准的PGOne技术组件Prometheus Server + Grafana + node_exporter完成对机器的

Linux监控 &nbsp; Nagios

Linux监控 Nagios 1 什么是监控? 监视控制 2 监控谁?        各种服务器 3 监控什么?     网络流量(eth0,eth1)   服务的状态(运行,停止)  硬件资源 cpu  内存 存储 系统运行情况(总数,运行,休眠,僵尸) [[email protected] 桌面]# uptime 09:15:02 up  15min,  4 users,  load average: 0.01, 0.10, 0.08 (数越大,说明在线时间越长,越好) [[email pr

LR添加Windows和Linux压力机实战

添加Windows和Linux压力机实战 既然Controller是LoadRunner的“心脏”,那么压力产生也必然是它发起的,通过压力机来对被测系统产生压力.一般压力机分为Windows和Linux.当并发量比较大时建议使用Linux. 1. 添加Windows压力机 添加Windows压力机的步骤相对来说简单些,具体如下. 1)保证要添加的压力机上安装了LoadRunner Agent,并启用(状态栏中会有一个小卫星). 2)添加的压力机与Controller所在机器要在同一个网段,建议把

几个常用的Linux监控脚本

几个常用的Linux监控脚本 几个常用的Linux监控脚本下面是几个主机监控的脚本,大家可以根据自己的情况再进行修改,希望能给大家一点帮助.1.查看主机网卡流量#!/bin/bash#network#Mike.Xuwhile : ; dotime='date +%m"-"%d" "%k":"%M'day='date +%m"-"%d'rx_before='ifconfig eth0|sed -n "8"p|

[Linux监控]磁盘空间大小

echo 192.168.10.69>>ip.list ------------------------------------------- #!/bin/bash #注意if和[]之间的空格 rm -f ~/fanr/shell/DiskUsageAlert/out.print out=$(cat ~/fanr/shell/DiskUsageAlert/ip.list) echo $out for _IP in $out do ssh [email protected]$_IP df |

Linux监控分析

一.linux硬件 CPU(计算.逻辑判断.逻辑处理).内存(cpu在内存中处理数据(记忆片段)).IO(对磁盘在一段时间内的读写操作) cpu和内存间有块区域缓存(二级缓存) cpu高:检查cpu,查看系统的瓶颈点是否在cpu上,看cpu把时间花费在哪个地方了,如果说,在这过程中,cup没有浪费时间,只能加cpu:如果cpu确实有浪费时间的地方,解决这个地方. cpu低:检查内存里的数据够不够,是否内存和磁盘在进行频繁的IO操作,如果cpu频繁的和磁盘进行IO操作,说明内存比较小,磁盘比较繁忙

Linux 监控系统---zabbix

监控系统及zabbix基础(一) =========================================================================== 概述: =========================================================================== 监控系统  1.监控系统介绍 ★监控指标: 硬件:如:cpu使用率,内存空间等 软件:软件程序如:nginx,进程数量等 业务:并发在线数量,事物数量等

Linux ---&gt; 监控JVM工具

Linux ---> 监控JVM工具shkingshking 发布时间: 2013/10/10 01:27 阅读: 2642 收藏: 26 点赞: 1 评论: 0 JDK内置工具使用 jps(Java Virtual Machine Process Status Tool)        查看所有的jvm进程,包括进程ID,进程启动的路径等等.    jstack(Java Stack Trace)        ① 观察jvm中当前所有线程的运行情况和线程当前状态.        ② 系统崩溃