面试官:你这JVM调优,回答的很有问题呀!!

共 4587字,需浏览 10分钟

 ·

2023-01-06 18:41

点击上方“Java技术江湖”,选择“设为星标

回复”666“获取全网最热的Java核心知识点整理

来源https://juejin.cn/post/7128377003224334373

1.写在前面

前段时间一位读者面了阿里,在二面中被问到 GC 日志分析,感觉回答的不是很好,过来找我复盘,大致听了他的回答,虽然回答出了部分,但是没抓到重点。

GC 日志分析算是 JVM 调优中比较难的部分,今天这篇文章就来聊聊如何利用 JDK 现有的命令并且借助可视化工具如何去分析 GC 日志。

2.JVM 调优实践

2.1 JVM 实践调优主要步骤

默认的策略是最普用,但不是最佳的。

  • 第一步:监控分析 GC 日志
  • 第二步:判断 JVM 问题 :
    • 如果各项参数设置合理,系统没有超时日志出现,GC 频率不高,GC 耗时不高,那么没有必要进行 GC 优化
    • 如果 GC 时间超过 1-3 秒,或者频繁 GC,则必须优化。
  • 第三步:确定调优目标
  • 第四步:调整参数
    • 调优一般是从满足程序的内存使用需求开始,之后是时间延迟要求,最后才是吞吐量要求,要基于这个步骤来不断优化,每一个步骤都是进行下一步的基础,不可逆行之。
  • 第五步:对比调优前后差距
  • 第六步:重复:1 、 2 、 3 、 4 、 5 步骤
    • 找到最佳 JVM 参数设置
  • 第七步:应用 JVM 到应用服务器 :
    • 找到最合适的参数,将这些参数应用到所有服务器,并进行后续跟踪。

以上,就是我们进行 jvm 调优得一些步骤了。

那我们就从第一步开始喽!!!^_^

2.2 分析 GC 日志

2.2.1 初始参数设置

机器环境:

指标参数
机器CPU 12 核,内存 16GB
集群规模单机
seqb_web 版本1.0
数据库4 核 16G

Jvm 调优典型参数设置;

  1. -Xms 堆内存的最小值 :默认情况下,当堆中可用内存小于 40%时,堆内存会开始增加,一直增加到-Xmx 的大小。
  2. -Xmx 堆内存的最大值:默认值是总内存/64(且小于 1G),默认情况下,当堆中可用内存大于 70%时,堆内存会开始减少,一直减小到-Xms 的大小;
  3. -Xmn 新生代内存的最大值:包括 Eden 区和两个 Survivor 区的总和,配置写法如:-Xmn1024k,-Xmn1024m,-Xmn1g
  4. -Xss 每个线程的栈内存:默认 1M,一般来说是不需要改。线程栈越小意味着可以创建的线程数越多

整个堆的大小 = 年轻代大小 + 年老代大小,堆的大小不包含元空间大小,如果增大了年轻代,年老代相应就会减小,官方默认的配置为年老代大小/年轻代大小=2/1 左右;

建议在开发测试环境可以用 Xms 和 Xmx 分别设置最小值最大值,但是在线上生产环境,Xms 和 Xmx 设置的值必须一样,防止抖动;

这里比较重要喔,一般我们都是将 Xms 和 Xmx 的值设置为一样的!!!

JVM 调优设置合大小堆内存空间,既不能太大,也不能太小。那么应该设置为多少呢?

默认的配置是否存在性能瓶颈。如果想要确定 JVM 性能问题瓶颈,需要进一步分析GC 日志

  1. -XX:+PrintGCDetails 开启 GC 日志创建更详细的 GC 日志 ,默认情况下,GC 日志是关闭的
  2. -XX:+PrintGCTimeStamps,-XX:+PrintGCDateStamps :开启 GC 时间提示
    • 开启时间便于我们更精确地判断几次 GC 操作之间的时两个参数的区别
    • 时间戳是相对于 0 (依据 JVM 启动的时间)的值,而日期戳(date stamp)是实际的日期字符串
    • 由于日期戳需要进行格式化,所以它的效率可能会受轻微的影响,不过这种操作并不频繁,它造成的影响也很难被我们感知。
  3. -XX:+PrintHeapAtGC 打印堆的 GC 日志
  4. -Xloggc:./logs/gc.log 指定 GC 日志路径

这里,我们是在 windows 下面进行测试,idea 配置如下:

-XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -XX:+PrintHeapAtGC -Xloggc:E:/logs/gc-default.log

这样就会在 e 盘下 logs 文件夹下面,生成 gc-default.log 日志

2.2.2 GC 日志解读

Young GC 日志含义

2022-08-05T13:45:23.336+0800: 4.866: [GC (Metadata GC Threshold) [PSYoungGen: 136353K->20975K(405504K)] 160049K->48437K(720384K), 0.0092260 secs] [Times: user=0.00 sys=0.02, real=0.02 secs]

这里的内容,我们一个一个解析:

2022-08-05T13:45:23.336+0800: 本次GC发生时间
4.866: 举例启动应用的时间
[GC【表示GC的类型,youngGC】 (Metadata GC Threshold) 元空间超阈值
[PSYoungGen: 136353K->20975K(405504K年轻代总空间)] 160049K->48437K(720384K)整堆), 0.0092260 secs本次垃圾回收耗时]
[Times: user=0.00本次GC消耗CPU的时间 sys=0.02系统暂停时间, real=0.02 secs实际应用暂停时间]

这里的解析,应该很详细了吧,还有谁看不懂的呢?

FullGC 日志含义

2022-08-05T20:24:47.815+0800: 6.955: [Full GC (Metadata GC Threshold) [PSYoungGen: 701K->0K(72704K)] [ParOldGen: 38678K->35960K(175104K)] 39380K->35960K(247808K), [Metaspace: 56706K->56706K(1099776K)], 0.1921975 secs] [Times: user=1.03 sys=0.00, real=0.19 secs]

这里的内容,我们也是一个一个解析:

2022-08-05T20:24:47.815+0800:
6.955: 刚启动服务就Full GC【整堆回收!!】

[Full GC (Metadata GC Threshold) Metaspace空间超限!
[PSYoungGen: 701K->0K(72704K)] 年轻代没有回收空间
[ParOldGen: 38678K->35960K(175104K)] 39380K->35960K(247808K), 老年代也没有到阈值,整堆更没有到阈值
[Metaspace: 56706K->56706K(1099776K)], 0.1921975 secs]
[Times: user=1.03本次GC消耗CPU的时间 sys=0.00系统暂停时间, real=0.19 secs实际应用暂停时间]

看到这里,有些哥们就会说,这么看,也太恶心了吧,密密麻麻的日志,看着头疼!!!

那么接下来我们来学一个 GC 日志可视化工具

2.2.3 GC 日志可视化分析

分析 GC 日志,就必须让 GC 日志输出到一个文件中,然后使用 GC 日志分析工具(gceasy.io/) 进行分析

这里分析完之后,可以下载分析报告

1) JVM 内存占用情况:
Generation【区域】Allocated【最大值】Peak【占用峰值】
Young Generation【年轻代】74.5 mb74.47 mb
Old Generation【老年轻代】171 mb95.62 mb
Meta Space【元空间】1.05 gb55.38 mb
Young + Old + Meta space【整体】1.3 gb212.64 mb
2) 关键性能指标:
image.png

1 、吞吐量:百分比越高表明 GC 开销越低。这个指标反映了 JVM 的吞吐量。

  • Throughput97.043%

2 、GC 延迟Latency

  • Avg Pause GC Time:7.80 ms 平均 GC 暂停时间
  • Max Pause GC Time:190 ms 最大 GC 暂停时间
3) GC 可视化交互聚合结果

由上图可以看到,发生了 3 次 full gc

存在问题:一开始就发生了 3 次 full gc , 很明显不太正常;

4) GC 统计

GC Statistics:GC 统计

由上图可以得到,发生 gc 的总次数,young gc,full gc 的统计,gc 暂停时间统计。

5) GC 原因:
原因次数平均时间最大时间总耗时
Metadata GC Threshold643.3 ms190 ms260 ms
Allocation Failure533.77 ms10.0 ms200 ms

这里对这些原因解析一下:

  1. Metadata GC Threshold:元空间超阈值
  2. Allocation Failure :年轻代空间不足

这里补充一个原因,本案例还没出现的:

  • Ergonomics:译文是“人体工程学”,GC 中的 Ergonomics 含义是负责自动调解 gc 暂停时间和吞吐量之间平衡从而产生的 GC。关注公众号:码猿技术专栏,回复关键词 1111 获取阿里内部 java 性能调优手册;目的是使得虚拟机性能更好的一种做法。

由此可见,通过可视化的工具,可以快速的帮我们分析 GC 的日志。我们得善于利用工具。

因为 gc 的日志文件,内容太多,都是密密麻麻的数字,文本。看得实在是头疼。

有了gc easy可视化工具,而且还是在线的,十分的方便。GC 日志分析是免费的

2.4K star,一个高性能、无侵入的Java性能监控和统计工具,有点东西!


Java 反射慢?它到底慢在哪?


Spring Boot 3 步完成日志脱敏,简单实用~


关注公众号【Java技术江湖】后回复“PDF”即可领取200+页的《Java工程师面试指南》

强烈推荐,几乎涵盖所有Java工程师必知必会的知识点,不管是复习还是面试,都很实用。



浏览 84
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报