Java服务,CPU 100%问题如何快速定位?
Java服务,有时候会遇到CPU 100%的问题,对于这样的问题,我们如何快速定位并解决呢?一般会有如下三个步骤:
1、找到最耗CPU的进程
2、找到这个进程中最耗CPU的线程
3、查看堆栈信息,定位线程的什么操作消耗了大量CPU,定位对应代码
下面通过一个实例来详解一下如何快速定位CPU问题
系统:CentOS 7
模拟CPU占用偏高的测试代码:
public class CpuUseTest {
public static void main(String[] args) {
new Thread() {
public void run() {
int result = 0;
while (true) {
result++;
if (result > Integer.MAX_VALUE / 2) {
result = 0;
}
}
}
}.start();
}
}
运行以上代码后,通过以下几步来查找CPU问题:
1、找到最耗CPU的进程
通过top命令查看进程的cpu占用情况,运行top命令后再键入P(大写p),进程会按照CPU使用率排序,如下图:
由上图可以看到,最耗CPU的进程PID为2601,CPU使用率达到了100%
2、找到这个进程中最耗CPU的线程
可以使用top命令:
top -Hp ${进程的PID}
也可以使用ps命令:
ps -mp ${进程的PID} -o THREAD,tid,time
我们以top命令为例:
top -Hp 2601
运行以上命令后再键入P(大写p),线程会按照CPU使用率排序,如下图:
可以看到进程2601的最耗CPU的线程PID为2611,CPU使用率达到了99.9%
3、查看堆栈信息,定位线程的什么操作消耗了大量CPU,定位对应代码
堆栈里,线程id是用16进制表示的,所以需要将线程PID转化为16进制:
printf "%x\n" 2611
输出:
a33
打印进程堆栈信息(注意2601是进程的PID),通过线程id,过滤得到线程堆栈:
jstack 2601 | grep a33 -A 20
输出信息如下:
由此可以看到,最耗CPU的代码为CpuUseTest.java代码中的第9行,也就是执行无限循环的代码块所在的位置。
至此导致该应用CPU偏高的问题,被成功定位。
4、查看堆栈信息中遇到的问题
刚开始查看堆栈信息的时候,使用了如下命令(请跟上面的命令对比一下,看看有什么不同):
jstack 2611 | grep a33 -A 20
结果报错:
是的,我把该写进程PID的地方,写成了线程PID,找了一圈,才解决这个问题,也耗费了不少时间。
评论