头条二面:你确定ThreadLocal真的会造成内存泄露?

爱笑的架构师

共 2387字,需浏览 5分钟

 ·

2021-11-05 17:18

ThreadLocal,java面试过程中的“钉子户”,在网上也充斥着各种有关ThreadLocal内存泄露的问题,本文换个角度,先思考ThreadLocal体系中的ThreadLocalMap为什么要设计成弱引用

1、ThreadLocal知识体系


本文还是不能免俗,在回答这个问题之前需要先和大家介绍一下ThreadLocal的知识,使大家对ThreadLocal有一个相对全面的认识。

ThreadLocal本地线程变量,主要用于解决数据访问的竞争,通常用于多租户、全链路压测、链路跟踪中保存线程上下文环境,在一个请求流转中非常方便的获取一些关键信息,例如当前的租户信息、压测标记。

ThreadLocal正如其名,本地线程变量,即数据存储在线程自己的局部变量中。

其整体架构如下图所示:

ThreadLocal的核心设计理念总结如下:
  • 每一个线程对象会维护一个私有属性:ThreadLocal.ThreadLocalMap threadLocals。

  • ThreadLocalMap内部结构为Key-Value键值对,其Key为ThreadLocal对象,Value为调用ThreadLocal的set方法设置的值。

一言以蔽之:ThreadLocal是将线程需要访问的数据存储在线程对象自身中,从而避免多线程的竞争

2、为什么会被设计为弱引用呢?


接下来我们来看一下ThreadLocalMap的声明:


什么?Map中的用于存储键值对的Entry为什么要继承WeakReference?

思考这个问题之前先和大家普及一下Java的4种引用类型,主要是在垃圾回收时java虚拟机会根据不同的引用类型采取不同的措施。

  • 强引用:java默认的引用类型,例如 Object a = new Object();其中 a 为强引用,new Object()为一个具体的对象。一个对象从根路径能找到强引用指向它,jvm虚拟机就不会回收。

  • 软引用(SoftReference):进行年轻代的垃圾回收不会触发SoftReference所指向对象的回收;但如果触发Full GC,那SoftReference所指向的对象将被回收。备注:是除了软引用之外没有其他强引用引用的情况下

  • 弱引用(WeakReference) :如果对象除了有弱引用指向它后没有其他强引用关联它,当进行年轻代垃圾回收时,该引用指向的对象就会被垃圾回收器回收。

  • 虚引用(PhantomeReference) 该引用指向的对象,无法对垃圾收集器收集对象时产生任何影响,但在执行垃圾回收后垃圾收集器会通过注册在PhantomeReference上的队列来通知应用程序对象被回收。

从四种弱引用的实际作用来说,主要是与垃圾回收器配合,决策什么时候可以将被引用的对象回收。

理论看起来有点晦涩难懂,接下来笔者将以图解的方式,争取将该问题阐述清楚。


根据第一部分,声明了一个TheadLocal对象,并且一个线程通过调用threadLocal对象的set(Object value)存储了一个对象,其引用如上图所示。

ThreadLocal的设计比较晦涩难懂,究其原因是我们通过threadLocal对象的set方法进行存储值,但数据并不是存储在ThreadLocal对象中,而是存储在当前调用该方法的线程对象中。但从应用者的角度来看,我们操作的对象是ThreadLocal,从设计上来说就应该为它考虑。

试问一个问题:如果应用程序觉得ThreadLocal对象的使命完成,将threadLocal ref 设置为null,如果Entry中引用ThreadLocald对象的引用类型设置为强引用的话,会发生什么问题?

答案是:ThreadLocal对象会无法被垃圾回收器回收,因为从thread对象出发,有强引用指向threadlocal obj。此时会违背用户的初衷,造成所谓的内存泄露。

由于ThreadLocalMap中的key是指向ThreadLocal,故从设计角度来看,设计为弱引用,将不会干扰用户的释放ThreadLocal意图。

3、大量Entry造成的内存溢出问题探讨


亮出了自己的观点,接下来我们再延伸一下,想再来谈谈网络上关于ThreadLocalMap中存储大量Entry对象导致的内存“泄露”问题。

温馨提示:本节仅代表我当前的观点,希望各位读者朋友们带着批判与辨证的思维来一起看待问题,而不是人云亦云。

网络观点:在使用ThreadLocal中set方法与remove方法需要成对执行,需要没有执行remove方法会造成内存泄露?甚至造成内存溢出?

我的观点:当然能成对使用当然更好,但在实际情况中,其实不调用remove方法也不太容易造成内存溢出,因为从存储结构来看,除非创建海量线程,并且这些线程都不释放,导致大量线程内部持有的ThreadLocalMap中对象一直不会释放,但一个线程所持有的Entry对象个数不多,取决于关联的ThreadLocal对象个数,故我们需要的关注点而不是remove方法,而是防止线程资源泄露

最后推荐一篇关于笔者在实践全链路压测时对ThreadLocal进行的调研与方案。

全链路跟踪(压测)必备基础组件之线程上下文“三剑客”


推荐阅读

10IT

“我”被阿里巴巴宠幸了


优秀程序员必备技能之如何高效阅读源码

我的另一种参与 RocketMQ 开源社区的方式

好了,本文就介绍到这里了,一键三连(关注、点赞、留言)是对我最大的鼓励

浏览 24
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报