在构建稳健的并发程序时,必须正确使用线程和锁。但是这终归只是一些机制。要编写线程安全的代码,其核心在于要对状态访问操作进行管理,特别是对共享的(Shared)和可变的(Mutable)状态的访问。
对象的状态是指存储在状态变量(例如实例或静态域)中的数据。
对象的状态可能包括其他依赖对象的域。比如某个HashMap的状态不仅是HashMap对象本身,还存储在许多Map.Entry对象中。
"共享"意味着变量可以由多个线程同时访问,而"可变"则意味着变量的值在其生命周期内可以变化。
线程安全性在于如何防止数据上发生不可控的并发访问。
一个对象是否需要是线程安全的,取决于它是否被多个线程访问。
要使对象是线程安全的,需要采用同步机制来协同对对象可变状态的访问。如果无法实现协同,那么可能导致数据破坏以及其他不该出现的结果。
协同多个线程对变量访问的同步机制主要有:
1. 关键字synchronized
2. 关键字volatile
3. 显式锁(Explicit Lock)
4. 原子变量
协同多线程访问一个可变的状态变量的方法有:
1. 不在线程之间共享该状态变量
2. 将状态变量修改为不可变的变量
3. 在访问状态变量时使用同步
什么是线程安全?
一个类在多线程环境下被访问,这个类始终能表现出正确的行为,那么就称这个类是线程安全的。
在线程安全类中往往都封装了必要的同步机制,因此客户端无须进一步采取措施。
无状态的对象一定是线程安全的。
无状态可以极大降低类在实现线程安全性时的复杂性。只有当类在保存一些信息的时候,线程安全才会成为一个问题。
原子性
当一个操作被CPU无可分割地执行时就是原子操作。
典型的非原子性操作就是a++,但是实际上这是一个"读取—修改—写入"的操作序列,并且结果状态依赖于之前的状态。
在并发编程中,由于不恰当的执行顺序而出现不正确的结果是一种非常重要的情况,就是竞态条件(Race Condition)。
竞态条件
当某个计算的正确性取决于多个线程的交替执行时序时,那么就会发生竞态条件。最常见的竞态条件就是"先检查后执行(Check-Then-Act)"操作,即通过一个可能失效的观测结果来决定下一步的动作。比如延迟初始化的单例模式。
复合操作
要避免竞态条件的问题,就必须在某个线程修改该变量时,通过某种方式防止其他线程使用这个变量,从而确保其他线程只能在修改操作完成或者之后读取和修改状态,而不是在修改状态的过程中。为了确保安全性,"先检查后执行"(例如延迟初始化)和"读取—修改—写入"(如递增运算)等必须是原子的。我们把"先检查后执行"(例如延迟初始化)和"读取—修改—写入"等操作统称为复合操作:包含了一组必须以原子方式执行的操作以确保线程安全性。
复合操作
加锁机制
内置锁
同步代码块
重入