为了让小白也能看懂这个死锁case,我请来了小黑...

捉虫大师

共 3751字,需浏览 8分钟

 ·

2024-03-27 20:00

小黑有点困,他想休息,又怕耽误时间,于是准备小眯一会。

为了能按时起来,他设了闹钟,作为程序员,必须得整两个,防止单点故障。

当任意一个闹钟响起,小黑就起来把两个闹钟都关掉,继续干活,就像这样:

      
      public class Clock {
    private BlackBro blackBro;

    public void setBlackBro(BlackBro blackBro) {
        this.blackBro = blackBro;
    }

    public synchronized void ring() {
        System.out.println(Thread.currentThread() + " Clock.ring...");
        blackBro.wake();
    }

    public synchronized void close() {
        System.out.println(Thread.currentThread() + " Clock.close...");
    }
}
      
      public class BlackBro {
    private Clock[] clocks;

    public void setClocks(Clock[] clocks) {
        this.clocks = clocks;
    }

    public synchronized void wake() {
        System.out.println(Thread.currentThread() + "BlackBro.wake...");
        for (Clock clock : clocks) {
            clock.close();
        }
    }
}

为了防止闹钟和小黑在执行操作期间被人打扰,我贴心地给他们都加上了锁 —— synchronized。

模拟这个场景将是这样:

      
      public static void main(String[] args) {
    Clock clock1 = new Clock();
    Clock clock2 = new Clock();
    BlackBro blackBro = new BlackBro();

    clock1.setBlackBro(blackBro);
    clock2.setBlackBro(blackBro);
    blackBro.setClocks(new Clock[]{clock1, clock2});

    // sleep...
    Thread t1 = new Thread(clock1::ring);
    Thread t2 = new Thread(clock2::ring);

    t1.start();
    t2.start();
}

启动程序发现,陷入了无尽地等待:

      
      Thread[Thread-0,5,main] Clock.ring...
Thread[Thread-1,5,main] Clock.ring...
Thread[Thread-1,5,main]BlackBro.wake...

这是怎么回事?眼尖的同学肯定发现问题了。我们看一下 jstack:

      
      Found one Java-level deadlock:
=============================
"Thread-0":
  waiting to lock monitor 0x0000600003ecc000 (object 0x000000070fc52398, a com.demo.BlackBro),
  which is held by "Thread-1"

"Thread-1":
  waiting to lock monitor 0x0000600003ec04e0 (object 0x000000070fc50f88, a com.demo.Clock),
  which is held by "Thread-0"

Java stack information for the threads listed above:
===================================================

原来是死锁了:我们起了两个闹钟线程,两个线程各自拿到自己的对象锁,开始 ring,ring 又都会去唤醒小黑,但小黑对象只有一个,只有一个闹钟能顺利拿到小黑的对象锁,小黑被唤醒后又去关闹钟,但却没法关掉,因为闹钟在等小黑唤醒的期间不会被别人打断,于是闹钟在等小黑,小黑在等闹钟,形成了死锁。

我相信稍微仔细点大家都能发现这个问题,这是因为我把干扰项都排除,只留下非常简单的框架。如果在一个非常复杂的系统中,还是很难发现的。这也是我今天遇到的一个线上问题,花了半天时间才排查出来。

这个 case 教育我们要谨慎使用锁,尤其是 synchronized;其次如果发现程序没有按预期地执行,尤其是该执行的没执行,可以留个心眼,看看堆栈是不是有死锁。

2024 年第一个小case送给你,你学废了吗?

浏览 17
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报