一、top之负载高
top -H -p pid 首先看load average 数值若小于0.7*CPU个数,则系统工作正常,如果超过这个值,甚至达到cpu核数的四五倍,则系统的负载就说明偏高且存在进一步升高的趋势,就需要进一步定位具体原因。通过vmstat命令查看cpu的上下文切换次数,
上下文切换次数发生的场景主要有如下几种:
1、时间切片用完,cpu正常调度下一个任务
2、被其他优先级更高的任务抢占
3、执行任务碰到I/O阻塞,挂起当前任务,切换到下一个任务
4、用户代码主动挂起当前任务让出CPU
5、多任务抢占资源,由于没有抢到被挂起
6、硬件中断
进程(proc):
R:运行队列中进程数量,这个值也可以判断是否需要增加cpu(长期大于1)
B:等待io进程数量
Memory(内存)
swpd:使用虚拟内存大小, 如果swpd的值不为0,但SI,SO的值长期为0,这种情况不会影响性能
free:空闲物理内存大小
buff:用作缓存的内存大小
cache:用作缓存的内存大小,如果cache值大的时候,说明cache处的文件数多,如果频繁访问到的文件都能被cache处,那么磁盘的IO bi会非常小
swap
Si : 每秒从交换区写到内存的大小,由磁盘调入内存
SO:每秒写入交换区的内存大小,由内存调入磁盘
注意:内存够用的时候,这2个值都是0,如果这两个值长期大于0时,系统性能会受到影响,磁盘IO和CPU资源都会被消耗。有些朋友看到空闲内存free很少的或者接近于0时,就认为内存不够用了,不能光看这一点,还要结合SI SO,如果free很少,但是SI和SO也很少(大多数时候是0),那么不用担心,系统性能这时不会受到影响的。因为linux总是先把内存用光
IO
bi :每秒读取的块数
bo:每秒写入的块数
注意:随机磁盘读写的时候,这2个值越大(如超过1024k),能看到CPU在IO等待的值也会越大
system(系统)
in:每秒中断数,包括时钟中断
cs:每秒上下文切换数
注意:上面2个值越大,会看到由内存消耗的CPU时间会越大
CPU(以百分比表示)
us:用户进程执行时间百分比(user time)的值比较高时,说明用户进程消耗的CPU时间多,那么我们就该考虑优化程序算法或者加速
sy:内存系统进程执行时间百分比(system time)sy的值越高时,说明系统内核消耗的CPU资源多,这并不是良性表现,我们应该检查原因
wa:IO等待时间百分比wa的值高时,说明IO等待比较严重,这可能由于磁盘大量做随机访问造成,也有可能磁盘出现瓶颈(块操作)
id:空闲时间百分比
二、JVM的方法
jstack命令配合top使用,top -H -p pid —> jstack -l pid ,一般需要打印三次,top -H -p pid 的pid需要转换成16进制(可以用计算器计算/printf “%x\n” pid),
然后在线程堆栈里面找到对应的nid,就可以找到对应问题线程栈
jstat命令可打印GC详细信息,Young GC 和Full GC次数,堆信息等。其命令格式为:jstat -gcutil -t pid <interval><count> (jstat -gcutil -t 8610 2000 100)
Jmap打印java进程堆信息 jmap -head pid 通过jmap -dump:file = xxx pid 可dump堆到文件,然后通过其他工具进一步分析其堆使用情况
jvm图形化页面dump可以通过mat工具进行查看
三、数据库调优一般从以下几个方面出发:
1、sql语句层面进行优化,慢sql分析,索引分析和调优,事务拆分等
2、在数据库配置层面进行优化,比如字段设计,调整缓存大小,磁盘I/O的等数据库参数优化,数据碎片整理等
3、从数据库层面进行优化,考虑数据库的垂直拆分和水平拆分等
4、选择合适的数据库引擎或者类型适应不同场景,比如考虑加入NoSQL等
原文地址:https://www.cnblogs.com/frankruby/p/11395964.html