java多线程4.构建并发模块

委托是创建线程安全类的一个最有效策略:只需让现有的线程安全类管理所有的状态即可

Java类库包含丰富的并发基础构建模块,如线程安全的容器以及各种用于协调多个相互协作的线程控制流的同步工具类

  • 1. 同步容器类

这些类的方式是:将它们的状态封装起来,并对每个公有方法都进行同步,使得每次只有一个线程能访问容器的状态。

同步容器类都是线程安全的,但在某些情况下可能需要额外的客户端加锁类保护复合操作如:迭代或者条件运算(若没有则添加)。

不过同步容器类是通过其自身的锁来保护它的每个方法,因此通过获得容器类的锁,可以在客户端构造原子操作。

    public static Object getLast(Vector list){
        synchronized(list){
            int lastIndex = list.size() - 1;
            return list.get(lastIndex);
        }
    }

通过在客户端加锁可以解决不可靠的迭代问题,但要牺牲一些伸缩性。在迭代期间导致其他线程无法访问,降低了并发性

        //在调用size和get之间存在并发访问
        synchronized(vector){
            for(int i=0; i<vector.size(); i++){
                doSomething(vector.get(i));
            }
        }

同步容器类的迭代器并没有考虑并发修改的问题,且它们表现出的行为是‘及时失败’,即当它们发现容器在迭代过程中被修改时会抛出ConcurrentModificationException。

要想避免ConcurrentModificationException,就必须在迭代过程中持有容器的锁。

如果不想在迭代期间对容器加锁,一种替代的方法就是克隆容器(克隆过程仍然要对容器加锁),在副本上进行迭代。

        List<String> list = Collections.synchronizedList(new ArrayList<String>());
        //可能抛出ConcurrentModificationException
        for(String s : list){
            doSomething(s);
        }

调用容器的toString,hsahVode,equals,containsAll,removeAll,retainAll等方法时,以及把容器作为参数的构造函数,都会间接的对容器进行迭代。

所有这些迭代操作都可能抛出ConcurrentModificationException。

  • 2. 并发容器

同步容器将所有对容器状态的访问都串行化,以实现他们的线程安全性,这种方法的代价是验证降低并发性。

Java 5.0提供了多种并发容器来改进同步容器的性能。

  • 2.1 Queue用来临时保存一组等待处理的元素。它提供几种实现包括:ConcurentLinkedQueue,传统的先进先出队列

BlockingQueue扩展了Queue,增加了可阻塞的插入和获取等操作。即如果队列为空,那么获取元素的操作将一直阻塞,直到队列中出现一个可用的元素;如果队列已满,那么插入元素的操作将一直阻塞,直到队列中出现可用的空间。在“生产者-消费者”模式中,阻塞队列是常用的方式。

  • 2.2 ConcurrentHashMap

同步容器类在执行每个操作期间都持有一个锁。在一些操作中,例如:HashMap.get或List.contains可能包含大量的工作,当遍历散列桶或链表来查找某个特定的对象时,必须在许多元素上调用equals(equals本身包含一定的计算量)。在基于散列的容器中,如果hashCode不能很均匀地分布散列值,那么容器中的元素就不会均匀地分布在整个容器中。某些情况下,某个糟糕的散列函数还会把一个散列表变成线性链表。当遍历很长的链表并且在某些或者全部元素上调用equals方法时,会花费相当长的时间,这段时间内其他线程都不能访问该容器。

与HashMap一样,ConcurrentHashMap也是基于散列的Map,但它使用了一种完全不同的加锁策略来提供更高的并发性和伸缩性。ConcurrentHashMap并不是将每个方法都在同一个锁上同步使得每次只能有一个线程访问容器,而是用一种粒度更细的加锁机制来实现更大程度的共享,这种机制称为分段锁。在这种机制中,任意数量的读取线程可以并发的访问Map,执行读取操作的线程和执行写入操作的线程可以并发的访问Map,并且一定数量的写入线程可以并发地修改Map。ConcurrentHashMap带来的结果是,在并发访问环境下将实现更高的吞吐量,而在单线程环境中只损失非常小的性能。

ConcurrentHashMap与其他并发容器一起增强了同步容器类:他们提供的迭代器不会抛出ConcurrentModificationException,因此不需要再迭代过程中对容器加锁。ConcurrentHashMap返回的迭代器具有弱一致性,弱一致性的迭代器可以容忍并发的修改,当创建迭代器时会遍历已有的元素,并可以(但不保证)在迭代器被构造后将修改操作反映给容器。

尽管有这些改进,但仍然有一些需要权衡的因素。对于一些需要在整个Map上进行计算的方法,例如:size和isEmpty,这些方法的语义被略微减弱了以反映容器的并发特性,由于size返回的结果在计算时可能已经过期了,它实际只是一个近似值,但这是允许的,虽然看上去令人有些不安,但事实上size和isEmpty这样的方法在并发环境下的用处很小,因为它们的返回值总在不断变化。从而这些操作的需求被弱化了,以换取对其他更重要操作的性能优化,如get,put,containsKey,remove等。

由于ConcurrentHashMap不能被加锁来执行独占访问,因此无法使用客户端加锁来创建新的原子操作,但一些常见的复合操作,若没有则添加putIfAbsent,若相等则去除,若相等则替换等,都已经实现为原子操作并在ConcurrentMap中声明。

  • 2.3 CopyOnWriteArrayList

CopyOnWriteArrayList(CopyOnWriteArraySet类似) 用于替代同步List,在某些情况下提供更好的并发性能,并且在迭代期间不需要对容器进行加锁和复制。

写入时复制容器的线程安全性在于,只要正确地发布一个事实不可变对象,那么在访问该对象时就不再需要进一步的同步。在每次修改时,都会创建并重新发布一个新的容器副本,从而实现可变性。容器的迭代器保留一个指向底层基础数组的引用,这个数组当前位于数组的起始位置,由于它不会被修改,因此在对其进行同步时只需确保数组内容的可见性。因此,多个线程可以同时对这个容器进行迭代,而不会彼此干扰或者与修改容器的线程相互干扰。容器返回的迭代器不会抛出ConCurrentModificationException,并且返回的元素与迭代器创建时的元素完全一致,而不必考虑之后修改所带来的影响。

显然,每当修改容器时都会复制底层数组,这需要一定的开销,尤其当容器的规模较大时。因此,仅当迭代操作远远多于修改操作时,才应该使用“写入时复制”容器。

  • 2.4 阻塞队列、生产者-消费者模式

阻塞队列提供可阻塞的put和take方法,以及定时的offer和poll方法。如果队列已经满了,那么put方法阻塞直到有空间可用;如果队列为空,那么take方法将会阻塞直到 有元素可用。队列可用有界也可用无界,无界队列永远都不会充满,因此无界队列的put方法永远也不会阻塞。

阻塞队列支持生产者-消费者模式。该模式将要完成的工作与执行工作两个过程分离开来,这样简化了开发过程,消除了生产者类和消费者类之间的代码依赖性,此外,该模式还将生产数据的过程与使用数据的过程解耦开来以简化工作负载的管理,因为这两个过程在处理数据的速率上有所不同。

一种最常见的生产者-消费者模式就是线程池与工作队列的组合,在Executor任务执行框架中体现了这种模式。

BlockingQueue的几种实现:

LinkedBlockigQueue和ArrayBlockingQueue是FIFO队列,二者区别分别与LinkedList与ArrayList类似,但比同步List拥有更好的并发性。

PriorityBlockingQueue是一个按优先级排序的队列,既可以根据元素的自然顺序来比较元素(元素实现了Comparable方法),也可以使用Comparator来比较。

SynchronousQueue 并不是一个真正的队列,因为它不会为队列中元素维护存储空间。与其他队列不同的是,它维护一组线程,这些线程在等待着把元素加入或移出队列。这种区别就好像将文件直接交给同事还是将文件放到他的邮箱中希望他能尽快拿到文件。因为没有存储功能,因此put和take会一直阻塞,直到有另一个线程已经准备好参与到交付过程中。仅当有足够多的消费者,并且总是有一个消费者准备好获取交付的工作时,才适合使用同步队列。

  • 示例:桌面搜索
/**
 * 在某个文件层次结构中搜索符合索引标准的文件,并将它们的名称放入工作队列。
 * 在Indexer中给出了一个消费者任务,即从队列中取出文件名称并对它们建立索引。
 * 将文件遍历与建立索引分解为独立操作,每个操作只需完成一个任务,并且阻塞队列将负责所有的控制流,因此每个功能的代码都更加简单清晰。
 * 生产者和消费者可以并发地执行。
 * 如果一个是I/O密集型,另一个是CPU密集型,那么并发执行的吞吐率要高于串行执行的吞吐率。
 * 如果二者并行度不同,那么耦合在一起的结果会把整体并行度降为二者中更小的并行度。
 * 由于每个程序都在各自的线程中运行,消费者线程永远不会退出,因而程序无法终止。
 */
public class FileCrawler implements Runnable{

    private final BlockingQueue<File> fileQueue;

    private final FileFilter fileFilter;

    private final File root;

    //...

    public void run() {
        try{
            crawl(root);
        }catch(InterruptedException e){
            Thread.currentThread().interrupt();
        }
    }

    private void crawl(File root) throws InterruptedException{

        File[] entries = root.listFiles(fileFilter);

        if(entries != null){
            for(File entry : entries){
                if(entry.isDirectory()){
                    crawl(entry);
                }else if(!alreadyIndexed(entry)){
                    fileQueue.put(entry);
                }
            }
        }
    }
}

class Indexer implements Runnable{

    private final BlockingQueue<File> queue;

    public Indexer(BlockingQueue<File> queue){
        this.queue = queue;
    }

    public void run(){
        try{
            while(true){
                indexFile(queue.take());
            }
        }catch(InterruptedException e){
            Thread.currentThread().interrupt();
        }
    }
}

#笔记内容来自《java并发编程实战》

原文地址:https://www.cnblogs.com/shanhm1991/p/9899045.html

时间: 2024-08-01 21:46:54

java多线程4.构建并发模块的相关文章

Java多线程与高并发:高并发解决思路

Java多线程与高并发:高并发解决思路 小玲子之凌空蹈虚关注 122018.11.21 09:55:30字数 1,553阅读 4,228 來源:http://www.wangtianyi.top/blog/2018/05/11/javaduo-xian-cheng-yu-gao-bing-fa-liu-gao-bing-fa-jie-jue-si-lu/ 缓存并发 image.png 当大量请求访问同一个没有被缓存的数据的时候,会发送大量请求给数据库,导致数据库压力过大,还会导致一致性问题,所以

Java多线程(四) —— 线程并发库之Atomic

一.从原子操作开始 从相对简单的Atomic入手(java.util.concurrent是基于Queue的并发包,而Queue,很多情况下使用到了Atomic操作,因此首先从这里开始). 很多情况下我们只是需要一个简单的.高效的.线程安全的递增递减方案.注意,这里有三个条件: 简单,意味着程序员尽可能少的操作底层或者实现起来要比较容易: 高效意味着耗用资源要少,程序处理速度要快: 线程安全也非常重要,这个在多线程下能保证数据的正确性. 这三个条件看起来比较简单,但是实现起来却难以令人满意. 通

java多线程10.构建同步工具

创建状态依赖类的最简单方法通常是在类库中现有状态依赖类的基础上进行构造.如果类库中没有提供你需要的功能,可以使用java语言和类库提供的底层机制来构造自己的同步机制,包括内置的条件队列.显示地Condition对象以及AbstractQueuedSynchronizer框架. 在单线程程序中调用方法时,如果基于某个状态的前提条件未得到满足,那么这个条件永远无法成真.而在并发程序中,基于状态的条件可能会由于其他线程的操作而改变.可阻塞的状态依赖操作 acquire lock on object s

java 多线程 同步 观察者 并发集合的一个例子

//第一版 package com.hra.riskprice; import com.hra.riskprice.SysEnum.Factor_Type; import org.springframework.boot.SpringApplication; import org.springframework.boot.autoconfigure.SpringBootApplication; import javax.swing.text.html.HTMLDocument; import j

Java多线程同步集合--并发库高级应用

ArrayBlockingQueueLinkedBlockingQueue 传统方式下用Collections工具类提供的synchronizedCollection方法来获得同步集合. java5中还提供了如下一些同步集合类:> java.util.concurrent - Java并发工具包> ConcurrentHashMap 进行HashMap的并发操作,用来替代Collections.synchronizedMap(m)方法.> ConcurrentSkipListMap 实现

Java多线程和并发总结

Java多线程和高并发总结 wait/notify必须存在于synchronized块中. volatile多线程的内存模型:main memory(主存).working memory(线程栈),在处理数据时,线程会把值从主存load到本地栈,完成操作后再save回去(volatile关键词的作用:每次针对该变量的操作都激发一次load and save) Thread类最佳实践: 写的时候最好要设置线程名称 Thread.name,并设置线程组 ThreadGroup,目的是方便管理.在出现

Java大型互联网-构建高并发和高可用的电商平台架构实践原理

并发,在操作系统中,是指一个时间段中有几个程序都处于已启动运行到运行完毕之间,且这几个程序都是在同一个处理机上运行,但任一个时刻点上只有一个程序在处理机上运行. "高可用性"(High Availability)通常来描述一个系统经过专门的设计,从而减少停工时间,而保持其服务的高度可用性. 一. 设计理念 1. 空间换时间 多级缓存,静态化 客户端页面缓存(http header中包含Expires/Cache of Control,last modified(304,server不返

java多线程并发系列之锁的深入了解

上一篇博客中 : java多线程.并发系列之 (synchronized)同步与加锁机制 .介绍了java中Synchronized和简单的加锁机制,在加锁的模块中介绍了 轮询锁和定时锁,简单回顾下 轮询锁:利用tryLock来获取两个锁,如果不能同时获得,那么回退并重新尝试. 定时锁:索取锁的时候可以设定一个超时时间,如果超过这个时间还没索取到锁,则不会继续堵塞而是放弃此次任务. 锁的公平性 在公平的锁上,线程将按照它们发出请求的顺序来获取锁 上面似乎忘记了还有一种可中断锁和可选择粒度锁 可中

JAVA多线程与并发学习总结

1.      计算机系统 使用高速缓存来作为内存与处理器之间的缓冲,将运算需要用到的数据复制到缓存中,让计算能快速进行:当运算结束后再从缓存同步回内存之中,这样处理器就无需等待缓慢的内存读写了. 缓存一致性:多处理器系统中,因为共享同一主内存,当多个处理器的运算任务都设计到同一块内存区域时,将可能导致各自的缓存数据不一致的情况,则同步回主内存时需要遵循一些协议. 乱序执行优化:为了使得处理器内部的运算单位能尽量被充分利用. 2.      JAVA内存模型 目标是定义程序中各个变量的访问规则.