（14）Reactor调度器与线程模型——响应式Spring的道法术器

本系列文章索引《响应式Spring的道法术器》
前情提要 Spring WebFlux快速上手 | Spring WebFlux性能测试
前情提要：Reactor 3快速上手 | 响应式流规范 | 自定义数据流
本文测试源码

2.4 调度器与线程模型

在1.3.2节简单介绍了不同类型的调度器Scheduler，以及如何使用publishOn和subscribeOn切换不同的线程执行环境。

下边使用一个简单的例子再回忆一下：

    @Test
    public void testScheduling() {
        Flux.range(0, 10)
//                .log()
                .publishOn(Schedulers.newParallel("myParallel"))
//                .log()
                .subscribeOn(Schedulers.newElastic("myElastic"))
                .log()
                .blockLast();
    }

只保留这个log()的话，可以看到，源头数据流是执行在myElastic-x线程上的；
只保留这个log()的话，可以看到，publishOn之后数据流是执行在myParallel-x线程上的；
只保留这个log()的话，可以看到，subscribeOn之后数据流依然是执行在myParallel-x线程上的。

通过以上三个log()的输出，可以发现，对于如下图所示的操作链：

publishOn会影响链中其后的操作符，比如第一个publishOn调整调度器为elastic，则filter的处理操作是在弹性线程池中执行的；同理，flatMap是执行在固定大小的parallel线程池中的；
subscribeOn无论出现在什么位置，都只影响源头的执行环境，也就是range方法是执行在单线程中的，直至被第一个publishOn切换调度器之前，所以range后的map也在单线程中执行。

这一节我们了解一下它的实现机制。

2.4.1 调度器

调度器相当于Reactor中的ExecutorService，不同的调度器定义不同的线程执行环境。Schedulers工具类提供的静态方法可搭建不同的线程执行环境。

Schedulers类已经预先创建了几种常用的不同线程池模型的调度器：使用single()、elastic()和parallel()方法创建的调度器可以分别使用内置的单线程、弹性线程池和固定大小线程池。如果想创建新的调度器，可以使用newSingle()、newElastic()和newParallel()方法。这些方法都是返回一个Scheduler的具体实现。

看一下Scheduler都有哪些行为：

public interface Scheduler extends Disposable {
    // 调度执行Runnable任务task。
    Disposable schedule(Runnable task);
    // 延迟一段指定的时间后执行。
    Disposable schedule(Runnable task, long delay, TimeUnit unit);
    // 周期性地执行任务。
    Disposable schedulePeriodically(Runnable task, long initialDelay, long period, TimeUnit unit);
    // 创建一个工作线程。
    Worker createWorker();
    // 启动调度器
    void start();
    // 以下两个方法可以暂时忽略
    void dispose();
    long now(TimeUnit unit)

    // 一个Worker代表调度器可调度的一个工作线程，在一个Worker内，遵循FIFO（先进先出）的任务执行策略
    interface Worker extends Disposable {
        // 调度执行Runnable任务task。
        Disposable schedule(Runnable task);
        // 延迟一段指定的时间后执行。
        Disposable schedule(Runnable task, long delay, TimeUnit unit);
        // 周期性地执行任务。
        Disposable schedulePeriodically(Runnable task, long initialDelay, long period, TimeUnit unit);
    }
}

如图所示，Scheduler是领导，Worker是员工，每个Scheduler手中有若干Worker。接到任务后，Scheduler负责分派，Worker负责干活。

在Scheduler中，每个Worker都是一个ScheduledExecutorService，或一个包装了ScheduledExecutorService的对象。所以，Scheduler拥有的并不是线程池，而是一个自行维护的ScheduledExecutorService池。

所谓“自行维护”，主要有三点：

可供调遣的Worker。比如Schedulers.newParallel()返回的ParallelScheduler，其内维护的是一个固定大小的ScheduledExecutorService[]数组；而ElasticScheduler由一个ExecutorService的Queue来维护。
任务分派策略。ElasticScheduler和ParallelScheduler都有一个pick()方法，用来选出合适的Worker。
对于要处理的任务，包装为Callable，从而可以异步地返回一个Future给调用者。

2.4.2 切换执行环境

再回到publishOn和subscribeOn方法。

在Reactor中，对于数据流的处理，实际上是一系列方法调用和基于事件的回调，包括subscribe、onSubscribe、request，以及onNext、onError、onComplete。拿出2.1节的图帮助理解：

当调用.subscribe()方法时，会形成从上游向下游的数据流，数据流中的元素通过onNext* (onError|onComplete)携带“顺流而下”。同时，Reactor使用者看不到的是，还有一条从下游向上游的“订阅链”，request就是沿着这个链向上反馈需求的。

publishOn方法能够将onNext、onError、onComplete调度到给定的Scheduler的Worker上执行。所以如上图场景中，再.map和.filter中间增加一个publisheOn(Schedulers.elastic())的话，.filter操作的onNext的过滤处理将会执行在ElasticScheduler的某个Worker上。

subscribeOn方法能够将subscribe（会调用onSubscribe）、request调度到给定的Scheduler的Worker上执行。所以在任何位置增加一个subscribeOn(Schedulers.elastic())的话，都会借助自下而上的订阅链，通过subscribe()方法，将线程执行环境传递到“源头”，从而Flux.just会执行在ElasticScheduler上。继而影响到其后的操作符，直至遇到publishOn改变了执行环境。

此外，有些操作符本身会需要调度器来进行多线程的处理，当你不明确指定调度器的时候，那些操作符会自行使用内置的单例调度器来执行。例如，Flux.delayElements(Duration) 使用的是 Schedulers.parallel()调度器对象：

    @Test
    public void testDelayElements() {
        Flux.range(0, 10)
                .delayElements(Duration.ofMillis(10))
                .log()
                .blockLast();
    }

从输出可以看到onNext运行在不同的线程上：

[ INFO] (main) onSubscribe(FluxConcatMap.ConcatMapImmediate)
[ INFO] (main) request(unbounded)
[ INFO] (parallel-1) onNext(0)
[ INFO] (parallel-2) onNext(1)
[ INFO] (parallel-3) onNext(2)
[ INFO] (parallel-4) onNext(3)
...

2.4.3 为数据流配置Context

在Reactor中，基于Scheduler的线程调度确实非常简单好用，但是还有个问题需要解决。

我们以往在编写多线程的代码时，如果涉及到只在线程内部使用的值，可能会使用ThreadLocal进行包装。

但是在响应式编程中，由于线程环境经常发生变化，这一用法就失去作用了，并且甚至带来bug。比如，使用 Logback 的 MDC 来存储日志关联的 ID 就属于这种情况。

自从版本 3.1.0，Reactor 引入了一个类似于 ThreadLocal 的高级功能：Context。它作用于一个 Flux 或一个 Mono 上，而不是应用于一个线程（Thread）。也就是其生命周期伴随整个数据流，而不是线程。

相对来说，用户使用Context并不多，对此感兴趣或有此需求的话，请看我翻译的相关文档，可以对Reactor内部实现尤其是Subscription有更深的理解。

2.4.4 并行执行

如今多核架构已然普及，能够方便的进行并行处理是很重要的。

对于一些能够在一个线程中顺序处理的任务，即使调度到ParallelScheduler上，通常也只由一个Worker来执行，比如：

    @Test
    public void testParallelFlux() throws InterruptedException {
        Flux.range(1, 10)
                .publishOn(Schedulers.parallel())
                .log().subscribe();
        TimeUnit.MILLISECONDS.sleep(10);
    }

输出如下：

[ INFO] (main) | onSubscribe([Fuseable] FluxPublishOn.PublishOnSubscriber)
[ INFO] (main) | request(unbounded)
[ INFO] (parallel-1) | onNext(1)
[ INFO] (parallel-1) | onNext(2)
[ INFO] (parallel-1) | onNext(3)
[ INFO] (parallel-1) | onNext(4)
[ INFO] (parallel-1) | onNext(5)
[ INFO] (parallel-1) | onNext(6)
[ INFO] (parallel-1) | onNext(7)
[ INFO] (parallel-1) | onNext(8)
[ INFO] (parallel-1) | onNext(9)
[ INFO] (parallel-1) | onNext(10)
[ INFO] (parallel-1) | onComplete()

有时候，我们确实需要一些任务能够“均匀”分布在不同的工作线程上执行，这时候就需要用到ParallelFlux。

你可以对任何Flux使用parallel()操作符来得到一个ParallelFlux。不过这个操作符本身并不会进行并行处理，而只是将负载划分到多个执行“轨道”上（默认情况下，轨道个数与CPU核数相等）。

为了配置ParallelFlux如何并行地执行每一个轨道，需要使用runOn(Scheduler)，这里，Schedulers.parallel() 是比较推荐的专门用于并行处理的调度器。

    @Test
    public void testParallelFlux() throws InterruptedException {
        Flux.range(1, 10)
                .parallel(2)
                .runOn(Schedulers.parallel())
//                .publishOn(Schedulers.parallel())
                .log()
                .subscribe();

        TimeUnit.MILLISECONDS.sleep(10);
    }

输出如下：

[ INFO] (main) onSubscribe([Fuseable] FluxPublishOn.PublishOnSubscriber)
[ INFO] (main) request(unbounded)
[ INFO] (main) onSubscribe([Fuseable] FluxPublishOn.PublishOnSubscriber)
[ INFO] (main) request(unbounded)
[ INFO] (parallel-1) onNext(1)
[ INFO] (parallel-2) onNext(2)
[ INFO] (parallel-1) onNext(3)
[ INFO] (parallel-2) onNext(4)
[ INFO] (parallel-1) onNext(5)
[ INFO] (parallel-2) onNext(6)
[ INFO] (parallel-1) onNext(7)
[ INFO] (parallel-2) onNext(8)
[ INFO] (parallel-1) onNext(9)
[ INFO] (parallel-2) onNext(10)
[ INFO] (parallel-1) onComplete()
[ INFO] (parallel-2) onComplete()

可以看到，各个元素的onNext “均匀”分布执行在两个线程上，最后每个线程上有独立的onComplete事件，这与publishOn调度到ParallelScheduler上的情况是不同的。

原文地址：http://blog.51cto.com/liukang/2093683

时间： 2024-11-06 07:34:15

（14）Reactor调度器与线程模型——响应式Spring的道法术器

2.4 调度器与线程模型

2.4.1 调度器

2.4.2 切换执行环境

2.4.3 为数据流配置Context

2.4.4 并行执行

（14）Reactor调度器与线程模型——响应式Spring的道法术器的相关文章

（12）Reactor 3 自定义数据流——响应式Spring的道法术器

（19）Reactor Processors——响应式Spring的道法术器

附2：Reactor 3 之选择合适的操作符——响应式Spring的道法术器

（15）Reactor 3 Operators——响应式Spring的道法术器

响应式Spring的道法术器（Spring WebFlux 快速上手 + 全面介绍）

（2）响应式流——响应式Spring的道法术器

（12）自定义数据流（实战Docker事件推送的REST API）——响应式Spring的道法术器

（3）lambda与函数式——响应式Spring的道法术器

（10）响应式宣言、响应式系统与响应式编程——响应式Spring的道法术器