如何优雅的使用和理解线程池----转

线程池原理

谈到线程池就会想到池化技术,其中最核心的思想就是把宝贵的资源放到一个池子中;每次使用都从里面获取,用完之后又放回池子供其他人使用,有点吃大锅饭的意思。

那在 Java 中又是如何实现的呢?

在 JDK 1.5 之后推出了相关的 api,常见的创建线程池方式有以下几种:

  • Executors.newCachedThreadPool():无限线程池。
  • Executors.newFixedThreadPool(nThreads):创建固定大小的线程池。
  • Executors.newSingleThreadExecutor():创建单个线程的线程池。

其实看这三种方式创建的源码就会发现:

1 public static ExecutorService newCachedThreadPool() {
2     return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
3                                   60L, TimeUnit.SECONDS,
4                                   new SynchronousQueue<Runnable>());
5 }

所以我们重点来看下 ThreadPoolExecutor 是怎么玩的。实际上还是利用 ThreadPoolExecutor 类实现的。

首先是创建线程的 api:

1 ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, RejectedExecutionHandler handler)

corePoolSize 为线程池的基本大小。这几个核心参数的作用:

  • maximumPoolSize 为线程池最大线程大小。
  • keepAliveTime 和 unit 则是线程空闲后的存活时间。
  • workQueue 用于存放任务的阻塞队列。
  • handler 当队列和最大线程池都满了之后的饱和策略。

了解了这几个参数再来看看实际的运用。

通常我们都是使用:

1 threadPool.execute(new Job());

在具体分析之前先了解下线程池中所定义的状态,这些状态都和线程的执行密切相关:这样的方式来提交一个任务到线程池中,所以核心的逻辑就是 execute() 函数了。

  • RUNNING 自然是运行状态,指可以接受任务执行队列里的任务
  • SHUTDOWN 指调用了 shutdown() 方法,不再接受新任务了,但是队列里的任务得执行完毕。
  • STOP 指调用了 shutdownNow() 方法,不再接受新任务,同时抛弃阻塞队列里的所有任务并中断所有正在执行任务。
  • TIDYING 所有任务都执行完毕,在调用 shutdown()/shutdownNow() 中都会尝试更新为这个状态。
  • TERMINATED 终止状态,当执行 terminated() 后会更新为这个状态。

用图表示为:

然后看看 execute() 方法是如何处理的:

  1. 获取当前线程池的状态。
  2. 当前线程数量小于 coreSize 时创建一个新的线程运行。
  3. 如果当前线程处于运行状态,并且写入阻塞队列成功。
  4. 双重检查,再次获取线程状态;如果线程状态变了(非运行状态)就需要从阻塞队列移除任务,并尝试判断线程是否全部执行完毕。同时执行拒绝策略。
  5. 如果当前线程池为空就新创建一个线程并执行。
  6. 如果在第三步的判断为非运行状态,尝试新建线程,如果失败则执行拒绝策略。

这里借助《聊聊并发》的一张图来描述这个流程:

如何配置线程

流程聊完了再来看看上文提到了几个核心参数应该如何配置呢?

有一点是肯定的,线程池肯定是不是越大越好。

通常我们是需要根据这批任务执行的性质来确定的。

  • IO 密集型任务:由于线程并不是一直在运行,所以可以尽可能的多配置线程,比如 CPU 个数 * 2
  • CPU 密集型任务(大量复杂的运算)应当分配较少的线程,比如 CPU 个数相当的大小。

当然这些都是经验值,最好的方式还是根据实际情况测试得出最佳配置。

优雅的关闭线程池

有运行任务自然也有关闭任务,从上文提到的 5 个状态就能看出如何来关闭线程池。

其实无非就是两个方法 shutdown()/shutdownNow()

但他们有着重要的区别:

  • shutdown() 执行后停止接受新任务,会把队列的任务执行完毕。
  • shutdownNow() 也是停止接受新任务,但会中断所有的任务,将线程池状态变为 stop。

两个方法都会中断线程,用户可自行判断是否需要响应中断。

shutdownNow() 要更简单粗暴,可以根据实际场景选择不同的方法。

我通常是按照以下方式关闭线程池的:

 1 long start = System.currentTimeMillis();
 2 for (int i = 0; i <= 5; i++) {
 3     pool.execute(new Job());
 4 }
 5 pool.shutdown();
 6 while (!pool.awaitTermination(1, TimeUnit.SECONDS)) {
 7     LOGGER.info("线程还在执行。。。");
 8 }
 9 long end = System.currentTimeMillis();
10 LOGGER.info("一共处理了【{}】", (end - start));

pool.awaitTermination(1, TimeUnit.SECONDS) 会每隔一秒钟检查一次是否执行完毕(状态为 TERMINATED),当从 while 循环退出时就表明线程池已经完全终止了。

SpringBoot 使用线程池

2018 年了,SpringBoot 盛行;来看看在 SpringBoot 中应当怎么配置和使用线程池。

既然用了 SpringBoot ,那自然得发挥 Spring 的特性,所以需要 Spring 来帮我们管理线程池:

 1 @Configuration
 2 public class TreadPoolConfig {
 3     /**
 4      * 消费队列线程
 5      * @return
 6      */
 7     @Bean(value = "consumerQueueThreadPool")
 8     public ExecutorService buildConsumerQueueThreadPool(){
 9         ThreadFactory namedThreadFactory = new ThreadFactoryBuilder()
10                 .setNameFormat("consumer-queue-thread-%d").build();
11         ExecutorService pool = new ThreadPoolExecutor(5, 5, 0L, TimeUnit.MILLISECONDS,
12                 new ArrayBlockingQueue<Runnable>(5),namedThreadFactory,new ThreadPoolExecutor.AbortPolicy());
13         return pool ;
14     }
15 }

使用时:

1 @Resource(name = "consumerQueueThreadPool")
2 private ExecutorService consumerQueueThreadPool;
3 @Override
4 public void execute() {
5     //消费队列
6     for (int i = 0; i < 5; i++) {
7         consumerQueueThreadPool.execute(new ConsumerQueueThread());
8     }
9 }

其实也挺简单,就是创建了一个线程池的 bean,在使用时直接从 Spring 中取出即可。

监控线程池

谈到了 SpringBoot,也可利用它 actuator 组件来做线程池的监控。

线程怎么说都是稀缺资源,对线程池的监控可以知道自己任务执行的状况、效率等。

关于 actuator 就不再细说了,感兴趣的可以看看这篇,有详细整理过如何暴露监控端点。

其实 ThreadPool 本身已经提供了不少 api 可以获取线程状态:

很多方法看名字就知道其含义,只需要将这些信息暴露到 SpringBoot 的监控端点中,我们就可以在可视化页面查看当前的线程池状态了。

甚至我们可以继承线程池扩展其中的几个函数来自定义监控逻辑:

看这些名称和定义都知道,这是让子类来实现的。

可以在线程执行前、后、终止状态执行自定义逻辑。

线程池隔离

线程池看似很美好,但也会带来一些问题。

如果我们很多业务都依赖于同一个线程池,当其中一个业务因为各种不可控的原因消耗了所有的线程,导致线程池全部占满。

这样其他的业务也就不能正常运转了,这对系统的打击是巨大的。

比如我们 Tomcat 接受请求的线程池,假设其中一些响应特别慢,线程资源得不到回收释放;线程池慢慢被占满,最坏的情况就是整个应用都不能提供服务。

所以我们需要将线程池进行隔离

通常的做法是按照业务进行划分:

比如下单的任务用一个线程池,获取数据的任务用另一个线程池。这样即使其中一个出现问题把线程池耗尽,那也不会影响其他的任务运行。

hystrix 隔离

这样的需求 Hystrix 已经帮我们实现了。

Hystrix 是一款开源的容错插件,具有依赖隔离、系统容错降级等功能。

下面来看看 Hystrix 简单的应用:

首先需要定义两个线程池,分别用于执行订单、处理用户。

 1 /**
 2  * Function:订单服务
 3  *
 4  * @author crossoverJie
 5  *         Date: 2018/7/28 16:43
 6  * @since JDK 1.8
 7  */
 8 public class CommandOrder extends HystrixCommand<String> {
 9     private final static Logger LOGGER = LoggerFactory.getLogger(CommandOrder.class);
10     private String orderName;
11     public CommandOrder(String orderName) {
12         super(Setter.withGroupKey(
13                 //服务分组
14                 HystrixCommandGroupKey.Factory.asKey("OrderGroup"))
15                 //线程分组
16                 .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("OrderPool"))
17                 //线程池配置
18                 .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
19                         .withCoreSize(10)
20                         .withKeepAliveTimeMinutes(5)
21                         .withMaxQueueSize(10)
22                         .withQueueSizeRejectionThreshold(10000))
23                 .andCommandPropertiesDefaults(
24                         HystrixCommandProperties.Setter()
25                                 .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
26         )
27         ;
28         this.orderName = orderName;
29     }
30     @Override
31     public String run() throws Exception {
32         LOGGER.info("orderName=[{}]", orderName);
33         TimeUnit.MILLISECONDS.sleep(100);
34         return "OrderName=" + orderName;
35     }
36 }
37 /**
38  * Function:用户服务
39  *
40  * @author crossoverJie
41  *         Date: 2018/7/28 16:43
42  * @since JDK 1.8
43  */
44 public class CommandUser extends HystrixCommand<String> {
45     private final static Logger LOGGER = LoggerFactory.getLogger(CommandUser.class);
46     private String userName;
47     public CommandUser(String userName) {
48         super(Setter.withGroupKey(
49                 //服务分组
50                 HystrixCommandGroupKey.Factory.asKey("UserGroup"))
51                 //线程分组
52                 .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("UserPool"))
53                 //线程池配置
54                 .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter()
55                         .withCoreSize(10)
56                         .withKeepAliveTimeMinutes(5)
57                         .withMaxQueueSize(10)
58                         .withQueueSizeRejectionThreshold(10000))
59                 //线程池隔离
60                 .andCommandPropertiesDefaults(
61                         HystrixCommandProperties.Setter()
62                                 .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD))
63         )
64         ;
65         this.userName = userName;
66     }
67     @Override
68     public String run() throws Exception {
69         LOGGER.info("userName=[{}]", userName);
70         TimeUnit.MILLISECONDS.sleep(100);
71         return "userName=" + userName;
72     }
73 }

api 特别简洁易懂,具体详情请查看官方文档。

然后模拟运行:

 1 public static void main(String[] args) throws Exception {
 2     CommandOrder commandPhone = new CommandOrder("手机");
 3     CommandOrder command = new CommandOrder("电视");
 4     //阻塞方式执行
 5     String execute = commandPhone.execute();
 6     LOGGER.info("execute=[{}]", execute);
 7     //异步非阻塞方式
 8     Future<String> queue = command.queue();
 9     String value = queue.get(200, TimeUnit.MILLISECONDS);
10     LOGGER.info("value=[{}]", value);
11     CommandUser commandUser = new CommandUser("张三");
12     String name = commandUser.execute();
13     LOGGER.info("name=[{}]", name);
14 }

运行结果:



可以看到两个任务分成了两个线程池运行,他们之间互不干扰。

获取任务任务结果支持同步阻塞和异步非阻塞方式,可自行选择。

它的实现原理其实容易猜到:

利用一个 Map 来存放不同业务对应的线程池。

通过刚才的构造函数也能证明:

还要注意的一点是:

自定义的 Command 并不是一个单例,每次执行需要 new 一个实例,不然会报 This instance can only be executed once. Please instantiate a new instance. 异常。

总结

池化技术确实在平时应用广泛,熟练掌握能提高不少效率。

原文地址:

https://crossoverjie.top/2018/07/29/java-senior/ThreadPool/

原文地址:https://www.cnblogs.com/laoxia/p/9760181.html

时间: 2024-11-05 10:24:58

如何优雅的使用和理解线程池----转的相关文章

如何优雅的使用和理解线程池

前言 平时接触过多线程开发的童鞋应该都或多或少了解过线程池,之前发布的<阿里巴巴 Java 手册>里也有一条: 可见线程池的重要性. 简单来说使用线程池有以下几个目的: 线程是稀缺资源,不能频繁的创建. 解耦作用:线程的创建于执行完全分开,方便维护. 应当将其放入一个池子中,可以给其他任务进行复用. 线程池原理 谈到线程池就会想到池化技术,其中最核心的思想就是把宝贵的资源放到一个池子中:每次使用都从里面获取,用完之后又放回池子供其他人使用,有点吃大锅饭的意思. 那在 Java 中又是如何实现的

Java核心(二)深入理解线程池ThreadPool

本文你将获得以下信息: 线程池源码解读 线程池执行流程分析 带返回值的线程池实现 延迟线程池实现 为了方便读者理解,本文会由浅入深,先从线程池的使用开始再延伸到源码解读和源码分析等高级内容,读者可根据自己的情况自主选择阅读顺序和需要了解的章节. 一.线程池优点 线程池能够更加充分的利用CPU.内存.网络.IO等系统资源,线程池的主要作用如下: 利用线程池可以复用线程,控制最大并发数: 实现任务缓存策略和拒绝机制: 实现延迟执行 阿里巴巴Java开发手册强制规定:线程资源必须通过线程池提供,如下图

深入理解线程池(转)

原作者:海子 出处:http://www.cnblogs.com/dolphin0520/    在前面的文章中,我们使用线程的时候就去创建一个线程,这样实现起来非常简便,但是就会有一个问题: 如果并发的线程数量很多,并且每个线程都是执行一个时间很短的任务就结束了,这样频繁创建线程就会大大降低系统的效率,因为频繁创建线程和销毁线程需要时间. 那么有没有一种办法使得线程可以复用,就是执行完一个任务,并不被销毁,而是可以继续执行其他的任务? 在Java中可以通过线程池来达到这样的效果.今天我们就来详

线程小酌之理解线程池

一.引言 在学习JAVASE部分中,我们都学习到了基本的线程创建继承THREAD类或实现Runnable接口,在正常负载情况下,为每个任务分配一个线程这种方法能够提升串行执行的性能.只要请求的导弹速率不超出服务器的请求处理能力,那么这种方法可以同时带来更快的响应性和更高的吞吐率.但是在实际开发过程中,开发环境和测试环境因数据流量并没有达到实际请求流量,并不能发现实际的问题,在生产环境中,为每个任务分配一个线程这种方法存在一些缺陷,尤其是当需要创建大量的线程时: 1.线程的生命周期的开销非常高 线

如何使用加拿大28源码下载理解线程池

平时接触过加拿大28源码下载[dashengba.com]Q3266397597多线程开发的童鞋应该都或多或少了解过线程池,之前发布的<阿里巴巴 Java 手册>里也有一条:可见线程池的重要性.简单来说使用线程池有以下几个目的:线程是稀缺资源,不能频繁的创建.解耦作用:线程的创建于执行完全分开,方便维护.应当将其放入一个池子中,可以给其他任务进行复用.线程池原理谈到线程池就会想到池化技术,其中最核心的思想就是把宝贵的资源放到一个池子中:每次使用都从里面获取,用完之后又放回池子供其他人使用,有点

【转】Java学习---深入理解线程池

[原文]https://www.toutiao.com/i6566022142666736131/ 我们使用线程的时候就去创建一个线程,这样实现起来非常简便,但是就会有一个问题: 如果并发的线程数量很多,并且每个线程都是执行一个时间很短的任务就结束了,这样频繁创建线程就会大大降低系统的效率,因为频繁创建线程和销毁线程需要时间. 那么有没有一种办法使得线程可以复用,就是执行完一个任务,并不被销毁,而是可以继续执行其他的任务? 在Java中可以通过线程池来达到这样的效果.今天我们就来详细讲解一下Ja

理解线程池,自己实现一个线程池

线程池本质是一个生产者-消费者模式,一边维护一些线程执行任务,一边由主线程添加一些任务.现在我们抛弃源码中一些繁杂的状态判断,自己写一个线程池. public class poolT { //可能频繁增删任务,链表队列效率较高 private final BlockingQueue<Runnable> workQueue = new LinkedBlockingQueue<Runnable>(); private final HashSet<Work> workers

Java多线程高并发学习笔记(三)——深入理解线程池

线程池最核心的一个类:ThreadPoolExecutor. 看一下该类的构造器: public ThreadPoolExecutor(int paramInt1, int paramInt2, long paramLong, TimeUnit paramTimeUnit, BlockingQueue<Runnable> paramBlockingQueue) { this(paramInt1, paramInt2, paramLong, paramTimeUnit, paramBlockin

使用和理解线程池

1.使用线程池的目的: 线程是稀缺资源,不能频繁的创建. 解耦作用:线程的创建与执行完全分开,方便维护. 应当将其放入一个池子中,可以给其他任务进行复用 2.线程池原理: 核心的思想就是把宝贵的资源放到一个池子中:每次使用都从里面获取,用完之后又放回池子供其他人使用. 3.配置线程池: 常见的线程: Executors.newCachedThreadPool():无限线程池. Executors.newFixedThreadPool(nThreads):创建固定大小的线程池. Executors