Spark Executor 概述

Spark Executor 工作原理：

1. 在CoarseGrainedExecutorBackend启动时向Driver注册Executor，其实质是注册ExecutorBackend实例，和Executor实例之间没有直接关系

2. CoarseGrainedExecutorBackend 是 Executor 运行所在的进程名称，Executor才是真正处理Task的对象。Executor内部是通过线程池的方式来完成Task的计算的

3. CoarseGrainedExecutorBackend 和 Executor是一一对应的

4. CoarseGrainedExecutorBackend 是一个消息通信体（其具体实现了ThreadSafeRPCEndpoint），可以发送信息给Driver并可以接受Driver中发过来的指令，例如启动Task等

5. 在Driver进程有两个至关重要的Endpoint：

a) ClientEndpoint : 主要负责向Master 注册当前的程序, 是AppClient的内部成员；

b) DriverEndpoint：这是整个程序运行时候的驱动器，是CoarseGrainedSchedulerBackend的内部成员；

6. 在Driver中通过ExecutorData封装并注册ExecutorBackend的信息到Driver的内存数据结构executorMapData中;

7. 实际在执行的时候，DriverEndPoint会把信息写CoarseGrainedSchedulerBackend的内存数据结构executorMapData，所以说最终是注册给了 CoarseGrainedSchedulerBackend，也就是说CoarseGrainedExecutorBackend 掌握了为当前程序分配的所有的ExecutorBackend进程，而在每一个ExecutorBackend进程实例中会通过 Executor对象来负责具体Task的运行。

8. CoarseGrainedExecutorBackend 收到 DriverEndpoint 发送过来的 RegisteredExecutor 消息后启动 Executor 实例对象，而Executor实例对象是事实上负责真正Task计算的

Executor具体是如何工作的：

1. 当Driver发送过来Task的时候，其实是发送给了CoarseGrainedExecutorBackend这个RpcEndpoint，而不是直接发送给了Executor

2. ExecutorBackend在收到Driver中发送过来的消息后会提供调用lauchTask来交给Executor去执行

时间： 2024-11-05 14:58:06

Spark Executor 概述

Spark Executor 概述的相关文章

Spark Executor内幕彻底解密(DT大数据梦工厂)

Spark Executor Driver资源调度小结

Spark Executor Driver资源调度汇总

Spark Executor内幕彻底解密：Executor工作原理图、ExecutorBackend注册源码解密、Executor实例化内幕、Executor具体工作内幕

大数据技术之_19_Spark学习_05_Spark GraphX 应用解析 + Spark GraphX 概述、解析 + 计算模式 + Pregel API + 图算法参考代码 + PageRank 实例

Spark（五十）：使用JvisualVM监控Spark Executor JVM

Spark内核概述

spark SQL概述

【Spark】概述