Linux下high CPU分析心得【非原创】

非原创,搬运至此以作笔记, 原地址:http://www.cnitblog.com/houcy/archive/2012/11/28/86801.html

1.用top命令查看哪个进程占用CPU高
gateway网关进程14094占用CPU高达891%,这个数值是进程内各个线程占用CPU的累加值。

PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND     
14094 root      15   0  315m  10m 7308 S 891%  2.2   1:49.01 gateway                                                                                 
20642 root      17   0 17784 4148 2220 S  0.5  0.8   2:39.96 microdasys                                                                                      
 1679 root      18   0 10984 1856 1556 R  0.3  0.4   0:22.21 sshd                                                                                            
22563 root      18   0  2424 1060  800 R  0.3  0.2   0:00.03 top                                                                                             
    1 root      18   0  2156  492  460 S  0.0  0.1   0:01.59 init

2.用top -H -p pid命令查看进程内各个线程占用的CPU百分比

#top -H -p 14094
top中可以看到有107个线程,但是下面9个线程占用CPU很高,下面以线程14086为主,分析其为何high CPU

PID USER      PR  NI  VIRT  RES  SHR S %CPU MEM    TIME+  COMMAND

14086 root      25   0  922m 914m 538m R  101 10.0  21:35.46 gateway

14087 root      25   0  922m 914m 538m R  101 10.0  10:50.22 gateway

14081 root      25   0  922m 914m 538m S   99 10.0   8:57.36 gateway

14082 root      25   0  922m 914m 538m R   99 10.0  11:51.92 gateway

14089 root      25   0  922m 914m 538m R   99 10.0  21:21.77 gateway

14092 root      25   0  922m 914m 538m R   99 10.0  19:55.47 gateway

14094 root      25   0  922m 914m 538m R   99 10.0  21:02.21 gateway

14083 root      25   0  922m 914m 538m R   97 10.0  21:32.39 gateway

14088  root       25   0   922m 914m  538m R    97 10.0   11:23.12  gateway

3.使用gstack命令查看进程中各线程的函数调用栈
#gstack 14094 > gstack.log
在gstack.log中查找线程ID14086,由于函数栈会暴露函数细节,因此只显示了两个函数桢,线程ID14086对应线程号是37

Thread 37 (Thread 0x4696ab90 (LWP 14086)):
#0  0x40000410 in __kernel_vsyscall ()
#1  0x40241f33 in poll () from /lib/i686/nosegneg/libc.so.6

4.使用gcore命令转存进程映像及内存上下文

#gcore 14094
该命令生成core文件core.14094

5。用strace命令查看系统调用和花费的时间
#strace -T -r -c -p 14094

-c参数显示统计信息,去掉此参数可以查看每个系统调用话费的时间及返回值。

% time     seconds  usecs/call     calls    errors        syscall

------ ----------- ----------- --------- --------- ----------------------------

99.99   22.683879        3385      6702                     poll

0.00    0.001132           0      6702                     gettimeofday

0.00    0.000127           1       208       208          accept

0.00    0.000022          22         1                    read

0.00    0.000000           0         1                    write

0.00    0.000000           0         1                    close

0.00    0.000000           0        14                    time

0.00    0.000000           0         2                    stat64

0.00    0.000000           0         4                    clock_gettime

0.00    0.000000           0         7                    send

0.00    0.000000           0        10        10          recvfrom

------ ----------- ----------- --------- --------- ------------------------------

100.00   22.685160                 13652       218 total

6.用gdb调试core文件,并线程切换到37号线程
gcore和实际的core dump时产生的core文件几乎一样,只是不能用gdb进行某些动态调试

(gdb) gdb gateway core.14094 
(gdb) thread 37
[Switching to thread 37 (Thread 0x4696ab90 (LWP 14086))]#0  0x40000410 in __kernel_vsyscall ()
(gdb) where
#0  0x40000410 in __kernel_vsyscall ()
#1  0x40241f33 in poll () from /lib/i686/nosegneg/libc.so.6

可以根据详细的函数栈进行gdb调试,打印一些变量值,并结合源代码分析为何会poll调用占用很高的CPU。
因为代码涉及到公司产权,顾不在此做详细分析,需要明白的是分析的流程和使用的命令。

流程为:进程ID->线程ID->线程函数调用栈->函数耗时和调用统计->源代码分析

时间: 2024-10-24 16:26:59

Linux下high CPU分析心得【非原创】的相关文章

Linux下查看CPU信息

linux下查看CPU的信息主要通过查看/proc/cpuinfo这个文件. 一.针对/proc/cpuinfo文件,我们需要查看processor,physical id,siblings,core id,cpu cores这几个字段. 1.拥有相同physical id的所有逻辑处理器共享同一个物理插座.每个physical id 代表一个唯一的物理封装,即一颗CPU. 2.Siblings表示位于一个物理封装的CPU上逻辑CPU的个数. 3.每个core id 均代表一个唯一的处理器内核,

Linux下获得CPU的信息

1.查看物理cpu个数 cat /proc/cupinfo |grep 'physical id'|sort|uniq|wc -l 2.查看一个cpu的物理核数 cat /proc/cupinfo |grep 'core id'|sort|uniq -c|wc -l 或 cat /proc/cupinfo |grep 'cpu cores'|uniq|awk -F ":" '{print $2}' 3.查看一个cpu的逻辑核数 cat /proc/cupinfo |grep 'sibl

Linux下apache日志分析与状态查看方法

假设apache日志格式为:118.78.199.98 – - [09/Jan/2010:00:59:59 +0800] “GET /Public/Css/index.css HTTP/1.1″ 304 – “http://www.a.cn/common/index.php” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GTB6.3)” 问题1:在apachelog中找出访问次数最多的10个IP.awk '{print $1}

linux下编译原理分析

linux下编译hello.c 程序,使用gcc hello.c,然后./a.out就可以运行:在这个简单的命令后面隐藏了许多复杂的过程,这个过程包括了下面的步骤: ====================================================================================== 预处理: 宏定义展开,所有的#define 在这个阶段都会被展开 预编译命令的处理,包括#if #ifdef 一类的命令 展开#include 的文件,像上面h

Linux下调节CPU使用的几种方法

一,使用taskset充分利用多核cpu,让cpu的使用率均衡到每个cpu上 #taskset-p,    设定一个已存在的pid,而不是重新开启一个新任务-c,    指定一个处理,可以指定多个,以逗号分隔,也可指定范围,如:2,4,5,6-8. 1,切换某个进程到指定的cpu上taskset -cp 3 13290 2,让某程序运行在指定的cpu上taskset -c 1,2,4-7 tar jcf test.tar.gz test 需要注意的是,taskset -cp 3 13290在设定

linux下自动化格式分区方法(非交互,可以用于shell脚本)

自动化格式分区方法----非交互---可用于脚本 要先给用户一个提示,让他选择一个分区来格式化 for i  in `mount|grep  "/dev/sdb"|awk '{print $1}'` do fuser –km $i;umount $i done dd if=/dev/zero  of=$PartDisk bs=512  count=1 sync;sleep 3 echo 'n p 1 +20M n p 2 +512M n p 3 +128M t 3 82 w'|fdis

Linux 下 apache 日志分析与状态查看[转]

假设apache日志格式为: 118.78.199.98 – - [09/Jan/2010:00:59:59 +0800] “GET /Public/Css/index.css HTTP/1.1″ 304 – “http://www.a.cn/common/index.php” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GTB6.3)” 问题1:在apachelog中找出访问次数最多的10个IP. awk '{print $

linux 下同步异步,阻塞非阻塞的一些想法

同步异步 阻塞非阻塞 今天和小伙伴讨论了这个问题,网上的说法有很多种,我按照自己的思路总结一边. 一句话总结区别: 同步异步关注的是事件发生时你的行为. 阻塞非阻塞关注的是的等待事件的状态. 下面看具体的分析 同步异步 同步: 在事件发生前,你的状态是时刻关注此事件,等待此事件给你返回结果. 例子: 烧水,同步就是你时刻关注着它,一段时间后,烧水壶冒烟了,你看见了,你知道水已经烧好. 那么在这段时间内你需要一直看着它是否冒烟. 异步: 在事件发生前,你并不关心此事件,而是自己去忙自己的,事件完成

linux概念之cpu分析

http://ilinuxkernel.com/?cat=4 Linux CPU占用率原理与精确度分析1  CPU占用率计算原理在Linux/Unix 下,CPU 利用率分为用户态.系统态和空闲态,分别表示CPU 处于用户态执行的时间,系统内核执行的时间,和空闲系统进程执行的时间. 下面是top显示的值1.1%us,  1.6%sy,  0.0%ni, 97.2%id,  0.0%wa,  0.0%hi,  0.1%si,  0.0%st      us: User time         用