自旋锁和互斥锁是多线程编程中的两个重要概念。他们都能用来锁定一些共享资源,以阻止影响数据一致性的并发访问。但是他们之间确实存在区别,那么这些区别是什么?
1 理论
理论上,当一个线程试图获取一个被锁定的互斥锁时,该操作会失败然后该线程会进入睡眠,这样就能马上让另一个线程运行。当持有互斥锁的线程释放该锁之后,进入睡眠状态的线程就会被唤醒。但是,当一个线程试图获取一个自旋锁而没有成功时,该线程会不断地重试,直到最终成功为止;因此该线程不会将运行权交到其他线程手中(当然,一旦当前线程的时间片超时,操作系统会强行切换到另一个线程)。
2 问题
互斥锁的问题在于:让线程睡眠和唤醒线程都是极为耗时的操作,完成这些操作需要大量CPU指令,因此也就需要耗费不少时间。如果只是锁定互斥锁很短一段时间,那么让线程睡眠和唤醒线程所花的时间可能会超过线程实际上睡眠的时间,甚至有可能会超过线程在自旋锁上轮询锁浪费的时间(如果使用自旋锁)。另一方面,在自旋锁上进行轮询会浪费CPU时间,如果自旋锁被锁定较长的时间,可能会浪费大量的CPU时间,这时让线程睡眠可能是一个更好的选择。
3 解决方法
在一个单核系统中使用自旋锁是行不通的,因为只要自旋锁轮询在阻塞当前CPU,那么就没有其他线程能够运行,既然没有其他线程能够运行,那么该锁也就不会被唤醒,对,我们进入死锁了。最好情况下,自旋锁仅仅浪费那些对系统没有任何用处的CPU时间。相反,如果使用互斥锁,线程A进入睡眠,那么另外一个线程B就能够立即运行,线程B有可能会释放锁,唤醒线程A,使线程A继续运行。
在一个多核系统,如果大量的锁只持有很短一段时间,那么让线程睡眠和唤醒线程所浪费的时间有可能会极大地降低运行时性能。相反,如果使用自旋锁,线程就有机会利用完全时间片(总是阻塞很短一段时间,然后立即运行),获得更高的吞吐量。
4 实践
由于大部分情况下,程序员不能预先知道使用互斥锁好还是使用自旋锁好(例如:因为不知道目标系统的CPU核心数量),同时操作系统也不知道某个片段的代码是否已经为单核或多核环境优化过,因此大部分系统不严格区分这两种锁。实际上,大部分现代操作系统都提供混合互斥锁和混合自旋锁。那么,什么是混合互斥锁和混合自旋锁?
在一个多核系统,混合互斥锁开始时会表现得像自旋锁。即如果一个线程A不能获取到互斥锁,那么线程A不会立即进入睡眠状态,因为该锁可能马上就被释放了,因此该互斥锁开始表现得像自旋锁。只有当一段固定的时间后,线程A还不能获取到该互斥锁,线程A才会进入睡眠状态。如果相同的程序运行在单核系统下,该互斥锁就不会表现出自旋锁的行为。
一个混合自旋锁开始时会表现得像一个普通的自旋锁,但为了避免浪费CPU时间,它提供了一个back-off策略。通常,混合自旋锁不会使线程进入睡眠状态(因为当你使用自旋锁时,你不希望发生这种情况),但是它能停止某个线程(立即或者一段固定的时间后),然后让另一个线程运行,以提高自旋锁的闲置率(一个纯粹的线程切换通常比使线程进入睡眠然后唤醒它效率更高,起码目前如此)。
5 总结
如果你不知道该使用哪一个,那么使用互斥锁,因为大部分现代操作系统都允许他们先自旋一小段时间(提前是该自旋有益), 所以互斥锁通常是更好的选择。有时,使用自旋锁会提升性能,在某些特定情况下,你可能会觉得使用自旋锁更好。这时候,使用你自己的锁对象,该锁对象内部使用自旋锁或者互斥锁实现(这个行为可以通过配置修改),开始时全部使用互斥锁,之后,如果你觉得某个地方使用自旋锁更好,那么修改它,然后比较下结果,但是在下结论之前,一定要记得在单核和多核环境下进行测试。