Java服务,CPU 100%问题如何快速定位?

共 2448字,需浏览 5分钟

 ·

2021-08-07 14:17

Java服务,有时候会遇到CPU 100%的问题,对于这样的问题,我们如何快速定位并解决呢?一般会有如下三个步骤:

1、找到最耗CPU的进程

2、找到这个进程中最耗CPU的线程

3、查看堆栈信息,定位线程的什么操作消耗了大量CPU,定位对应代码


下面通过一个实例来详解一下如何快速定位CPU问题

系统:CentOS 7

模拟CPU占用偏高的测试代码:

public class CpuUseTest {
    public static void main(String[] args) {        new Thread() {            public void run() {                int result = 0;                while (true) {                    result++;                    if (result > Integer.MAX_VALUE / 2) {                        result = 0;                    }                }            }        }.start();    }}

运行以上代码后,通过以下几步来查找CPU问题:

1、找到最耗CPU的进程

通过top命令查看进程的cpu占用情况,运行top命令后再键入P(大写p),进程会按照CPU使用率排序,如下图:

    

由上图可以看到,最耗CPU的进程PID为2601,CPU使用率达到了100%

    

2、找到这个进程中最耗CPU的线程

可以使用top命令:

top -Hp ${进程的PID}

也可以使用ps命令:

ps -mp ${进程的PID} -o THREAD,tid,time

我们以top命令为例:

top -Hp 2601

运行以上命令后再键入P(大写p),线程会按照CPU使用率排序,如下图:

    

可以看到进程2601的最耗CPU的线程PID为2611,CPU使用率达到了99.9%


3、查看堆栈信息,定位线程的什么操作消耗了大量CPU,定位对应代码

堆栈里,线程id是用16进制表示的,所以需要将线程PID转化为16进制:

printf "%x\n" 2611

输出:

a33

打印进程堆栈信息(注意2601是进程的PID),通过线程id,过滤得到线程堆栈:

jstack 2601 | grep a33 -A 20

输出信息如下:


由此可以看到,最耗CPU的代码为CpuUseTest.java代码中的第9行,也就是执行无限循环的代码块所在的位置。


至此导致该应用CPU偏高的问题,被成功定位。


4、查看堆栈信息中遇到的问题

刚开始查看堆栈信息的时候,使用了如下命令(请跟上面的命令对比一下,看看有什么不同):

jstack 2611 | grep a33 -A 20

结果报错:


是的,我把该写进程PID的地方,写成了线程PID,找了一圈,才解决这个问题,也耗费了不少时间。


浏览 43
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报