线程池原理
谈到线程池就会想到池化技术,其中最核心的思想就是把宝贵的资源放到一个池子中;每次使用都从里面获取,用完之后又放回池子供其他人使用,有点吃大锅饭的意思。
那在 Java 中又是如何实现的呢?
在 JDK 1.5 之后推出了相关的 api,常见的创建线程池方式有以下几种:
Executors.newCachedThreadPool()
:无限线程池。Executors.newFixedThreadPool(nThreads)
:创建固定大小的线程池。Executors.newSingleThreadExecutor()
:创建单个线程的线程池。
其实看这三种方式创建的源码就会发现:
1 public static ExecutorService newCachedThreadPool() { 2 return new ThreadPoolExecutor(0, Integer.MAX_VALUE, 3 60L, TimeUnit.SECONDS, 4 new SynchronousQueue<Runnable>()); 5 }
所以我们重点来看下 ThreadPoolExecutor
是怎么玩的。实际上还是利用 ThreadPoolExecutor
类实现的。
首先是创建线程的 api:
1 ThreadPoolExecutor(int corePoolSize, int maximumPoolSize, long keepAliveTime, TimeUnit unit, BlockingQueue<Runnable> workQueue, RejectedExecutionHandler handler)
corePoolSize
为线程池的基本大小。这几个核心参数的作用:
maximumPoolSize
为线程池最大线程大小。keepAliveTime
和unit
则是线程空闲后的存活时间。workQueue
用于存放任务的阻塞队列。handler
当队列和最大线程池都满了之后的饱和策略。
了解了这几个参数再来看看实际的运用。
通常我们都是使用:
1 threadPool.execute(new Job());
在具体分析之前先了解下线程池中所定义的状态,这些状态都和线程的执行密切相关:这样的方式来提交一个任务到线程池中,所以核心的逻辑就是 execute()
函数了。
RUNNING
自然是运行状态,指可以接受任务执行队列里的任务SHUTDOWN
指调用了shutdown()
方法,不再接受新任务了,但是队列里的任务得执行完毕。STOP
指调用了shutdownNow()
方法,不再接受新任务,同时抛弃阻塞队列里的所有任务并中断所有正在执行任务。TIDYING
所有任务都执行完毕,在调用shutdown()/shutdownNow()
中都会尝试更新为这个状态。TERMINATED
终止状态,当执行terminated()
后会更新为这个状态。
用图表示为:
然后看看 execute()
方法是如何处理的:
- 获取当前线程池的状态。
- 当前线程数量小于 coreSize 时创建一个新的线程运行。
- 如果当前线程处于运行状态,并且写入阻塞队列成功。
- 双重检查,再次获取线程状态;如果线程状态变了(非运行状态)就需要从阻塞队列移除任务,并尝试判断线程是否全部执行完毕。同时执行拒绝策略。
- 如果当前线程池为空就新创建一个线程并执行。
- 如果在第三步的判断为非运行状态,尝试新建线程,如果失败则执行拒绝策略。
这里借助《聊聊并发》的一张图来描述这个流程:
如何配置线程
流程聊完了再来看看上文提到了几个核心参数应该如何配置呢?
有一点是肯定的,线程池肯定是不是越大越好。
通常我们是需要根据这批任务执行的性质来确定的。
- IO 密集型任务:由于线程并不是一直在运行,所以可以尽可能的多配置线程,比如 CPU 个数 * 2
- CPU 密集型任务(大量复杂的运算)应当分配较少的线程,比如 CPU 个数相当的大小。
当然这些都是经验值,最好的方式还是根据实际情况测试得出最佳配置。
优雅的关闭线程池
有运行任务自然也有关闭任务,从上文提到的 5 个状态就能看出如何来关闭线程池。
其实无非就是两个方法 shutdown()/shutdownNow()
。
但他们有着重要的区别:
shutdown()
执行后停止接受新任务,会把队列的任务执行完毕。shutdownNow()
也是停止接受新任务,但会中断所有的任务,将线程池状态变为 stop。
两个方法都会中断线程,用户可自行判断是否需要响应中断。
shutdownNow()
要更简单粗暴,可以根据实际场景选择不同的方法。
我通常是按照以下方式关闭线程池的:
1 long start = System.currentTimeMillis(); 2 for (int i = 0; i <= 5; i++) { 3 pool.execute(new Job()); 4 } 5 pool.shutdown(); 6 while (!pool.awaitTermination(1, TimeUnit.SECONDS)) { 7 LOGGER.info("线程还在执行。。。"); 8 } 9 long end = System.currentTimeMillis(); 10 LOGGER.info("一共处理了【{}】", (end - start));
pool.awaitTermination(1, TimeUnit.SECONDS) 会每隔一秒钟检查一次是否执行完毕(状态为 TERMINATED),当从 while 循环退出时就表明线程池已经完全终止了。
SpringBoot 使用线程池
2018 年了,SpringBoot 盛行;来看看在 SpringBoot 中应当怎么配置和使用线程池。
既然用了 SpringBoot ,那自然得发挥 Spring 的特性,所以需要 Spring 来帮我们管理线程池:
1 @Configuration 2 public class TreadPoolConfig { 3 /** 4 * 消费队列线程 5 * @return 6 */ 7 @Bean(value = "consumerQueueThreadPool") 8 public ExecutorService buildConsumerQueueThreadPool(){ 9 ThreadFactory namedThreadFactory = new ThreadFactoryBuilder() 10 .setNameFormat("consumer-queue-thread-%d").build(); 11 ExecutorService pool = new ThreadPoolExecutor(5, 5, 0L, TimeUnit.MILLISECONDS, 12 new ArrayBlockingQueue<Runnable>(5),namedThreadFactory,new ThreadPoolExecutor.AbortPolicy()); 13 return pool ; 14 } 15 }
使用时:
1 @Resource(name = "consumerQueueThreadPool") 2 private ExecutorService consumerQueueThreadPool; 3 @Override 4 public void execute() { 5 //消费队列 6 for (int i = 0; i < 5; i++) { 7 consumerQueueThreadPool.execute(new ConsumerQueueThread()); 8 } 9 }
其实也挺简单,就是创建了一个线程池的 bean,在使用时直接从 Spring 中取出即可。
监控线程池
谈到了 SpringBoot,也可利用它 actuator 组件来做线程池的监控。
线程怎么说都是稀缺资源,对线程池的监控可以知道自己任务执行的状况、效率等。
关于 actuator 就不再细说了,感兴趣的可以看看这篇,有详细整理过如何暴露监控端点。
其实 ThreadPool 本身已经提供了不少 api 可以获取线程状态:
很多方法看名字就知道其含义,只需要将这些信息暴露到 SpringBoot 的监控端点中,我们就可以在可视化页面查看当前的线程池状态了。
甚至我们可以继承线程池扩展其中的几个函数来自定义监控逻辑:
看这些名称和定义都知道,这是让子类来实现的。
可以在线程执行前、后、终止状态执行自定义逻辑。
线程池隔离
线程池看似很美好,但也会带来一些问题。
如果我们很多业务都依赖于同一个线程池,当其中一个业务因为各种不可控的原因消耗了所有的线程,导致线程池全部占满。
这样其他的业务也就不能正常运转了,这对系统的打击是巨大的。
比如我们 Tomcat 接受请求的线程池,假设其中一些响应特别慢,线程资源得不到回收释放;线程池慢慢被占满,最坏的情况就是整个应用都不能提供服务。
所以我们需要将线程池进行隔离。
通常的做法是按照业务进行划分:
比如下单的任务用一个线程池,获取数据的任务用另一个线程池。这样即使其中一个出现问题把线程池耗尽,那也不会影响其他的任务运行。
hystrix 隔离
这样的需求 Hystrix 已经帮我们实现了。
Hystrix 是一款开源的容错插件,具有依赖隔离、系统容错降级等功能。
下面来看看 Hystrix
简单的应用:
首先需要定义两个线程池,分别用于执行订单、处理用户。
1 /** 2 * Function:订单服务 3 * 4 * @author crossoverJie 5 * Date: 2018/7/28 16:43 6 * @since JDK 1.8 7 */ 8 public class CommandOrder extends HystrixCommand<String> { 9 private final static Logger LOGGER = LoggerFactory.getLogger(CommandOrder.class); 10 private String orderName; 11 public CommandOrder(String orderName) { 12 super(Setter.withGroupKey( 13 //服务分组 14 HystrixCommandGroupKey.Factory.asKey("OrderGroup")) 15 //线程分组 16 .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("OrderPool")) 17 //线程池配置 18 .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter() 19 .withCoreSize(10) 20 .withKeepAliveTimeMinutes(5) 21 .withMaxQueueSize(10) 22 .withQueueSizeRejectionThreshold(10000)) 23 .andCommandPropertiesDefaults( 24 HystrixCommandProperties.Setter() 25 .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD)) 26 ) 27 ; 28 this.orderName = orderName; 29 } 30 @Override 31 public String run() throws Exception { 32 LOGGER.info("orderName=[{}]", orderName); 33 TimeUnit.MILLISECONDS.sleep(100); 34 return "OrderName=" + orderName; 35 } 36 } 37 /** 38 * Function:用户服务 39 * 40 * @author crossoverJie 41 * Date: 2018/7/28 16:43 42 * @since JDK 1.8 43 */ 44 public class CommandUser extends HystrixCommand<String> { 45 private final static Logger LOGGER = LoggerFactory.getLogger(CommandUser.class); 46 private String userName; 47 public CommandUser(String userName) { 48 super(Setter.withGroupKey( 49 //服务分组 50 HystrixCommandGroupKey.Factory.asKey("UserGroup")) 51 //线程分组 52 .andThreadPoolKey(HystrixThreadPoolKey.Factory.asKey("UserPool")) 53 //线程池配置 54 .andThreadPoolPropertiesDefaults(HystrixThreadPoolProperties.Setter() 55 .withCoreSize(10) 56 .withKeepAliveTimeMinutes(5) 57 .withMaxQueueSize(10) 58 .withQueueSizeRejectionThreshold(10000)) 59 //线程池隔离 60 .andCommandPropertiesDefaults( 61 HystrixCommandProperties.Setter() 62 .withExecutionIsolationStrategy(HystrixCommandProperties.ExecutionIsolationStrategy.THREAD)) 63 ) 64 ; 65 this.userName = userName; 66 } 67 @Override 68 public String run() throws Exception { 69 LOGGER.info("userName=[{}]", userName); 70 TimeUnit.MILLISECONDS.sleep(100); 71 return "userName=" + userName; 72 } 73 }
api
特别简洁易懂,具体详情请查看官方文档。
然后模拟运行:
1 public static void main(String[] args) throws Exception { 2 CommandOrder commandPhone = new CommandOrder("手机"); 3 CommandOrder command = new CommandOrder("电视"); 4 //阻塞方式执行 5 String execute = commandPhone.execute(); 6 LOGGER.info("execute=[{}]", execute); 7 //异步非阻塞方式 8 Future<String> queue = command.queue(); 9 String value = queue.get(200, TimeUnit.MILLISECONDS); 10 LOGGER.info("value=[{}]", value); 11 CommandUser commandUser = new CommandUser("张三"); 12 String name = commandUser.execute(); 13 LOGGER.info("name=[{}]", name); 14 }
运行结果:
可以看到两个任务分成了两个线程池运行,他们之间互不干扰。
获取任务任务结果支持同步阻塞和异步非阻塞方式,可自行选择。
它的实现原理其实容易猜到:
利用一个 Map 来存放不同业务对应的线程池。
通过刚才的构造函数也能证明:
还要注意的一点是:
自定义的 Command 并不是一个单例,每次执行需要 new 一个实例,不然会报
This instance can only be executed once. Please instantiate a new instance.
异常。
总结
池化技术确实在平时应用广泛,熟练掌握能提高不少效率。
原文地址:
https://crossoverjie.top/2018/07/29/java-senior/ThreadPool/
原文地址:https://www.cnblogs.com/laoxia/p/9760181.html