服务器上tomcat启动之后,使用top查看cpu使用率,竟然达到200%,虽然服务器配置有8核,但是业务量一大,扛不住滴。于是,通过以下方法排查问题:
1、查看占用cpu高的进程数:
根据top命令,发现PID为14586的Java进程占用CPU高达200%,出现故障。
通过ps aux | grep PID命令,可以进一步确定是tomcat进程出现了问题。但是,怎么精确到问题所在呢?
首先显示线程列表:
ps -mp pid -o THREAD,tid,time
找到耗时最高的线程id为:14634,14635
其次将需要的线程ID转换为16进制格式:
printf "%x\n" tid
最后打印线程的堆栈信息:
jstack pid |grep tid -A 30
同样的,看下另外一个线程。也是这样的情况,经过分析,开发认为是之前版本获取数据的线程一直处于等待状态,更改版本为:每隔5分钟启动进程,加入容器功能等等。细节要开发才明白了。
最后,总结下排查CPU故障的方法和技巧有哪些:
1、top命令:Linux命令。可以查看实时的CPU使用情况。也可以查看最近一段时间的CPU使用情况。
2、PS命令:Linux命令。强大的进程状态监控命令。可以查看进程以及进程中线程的当前CPU使用情况。属于当前状态的采样数据。
3、jstack:Java提供的命令。可以查看某个进程的当前线程栈运行情况。根据这个命令的输出可以定位某个进程的所有线程的当前运行状态、运行代码,以及是否死锁等等。
4、pstack:Linux命令。可以查看某个进程的当前线程栈运行情况。
时间: 2024-10-25 06:38:55