Spark Netty 通信框架解析

1、RpcEndpoint: RPC端点

Spark针对每个节点(Client、Master、Worker)都称之为一个RpcEndpoint,且都实现RpcEndpoint接口,内部根据不同端点的需求,设计不同的消息和不同的业务处理,如果需要发送(询问)则内部调用Dispatcher的对应方法

说明:

  • RpcEndpoint 用来接收消息
  • RpcEndpointRef 用来发送消息

RpcEndpointRef的具体实现类是: NettyRpcEndpointRef

2、RpcEnv:Rpc上下文(Rpc环境)

每个RpcEndpoint运行时依赖的上下文环境称为 RpcEnv

3、Dispatcher:消息分发器

PC 端点需要发送消息或者从远程 RPC 端点接收到的消息,分发至对应的指令收件箱/发件箱

  • 如果指令接收方是自己则存入收件箱
  • 如果指令接收方不是自己则放入发件箱
 1 // class NettyRpcEnv
 2 private[netty] def send(message: RequestMessage): Unit = {
 3     // 获取接收者地址信息
 4     val remoteAddr = message.receiver.address
 5     if (remoteAddr == address) {
 6         // Message to a local RPC endpoint.
 7         // 把消息发送到本地的 RPC 端点  (发送到收件箱)
 8         try {
 9            dispatcher.postOneWayMessage(message)
10         } catch {
11            case e: RpcEnvStoppedException => logWarning(e.getMessage)
12         }
13     } else {
14         // Message to a remote RPC endpoint.
15         // 把消息发送到远程的 RPC 端点.  (发送到发件箱)
16         postToOutbox(message.receiver, OneWayOutboxMessage(serialize(message)))
17     }
18 }

4、Inbox:指令消息收件箱

一个本地 RpcEndpoint 对应一个收件箱

5、RpcEndpointRef:RpcEndpointRef 是对远程 RpcEndpoint 的一个引用

当我们需要向一个具体的 RpcEndpoint 发送消息时,一般我们需要获取到该RpcEndpoint 的引用,然后通过该引用发送消息

6、OutBox:指令消息发件箱

对于当前 RpcEndpoint 来说,一个目标 RpcEndpoint 对应一个当前的发件箱,如果向多个目标 RpcEndpoint 发送信息,则有当前会有多个 OutBox

当消息放入 Outbox 后,紧接着通过 TransportClient 将消息发送出去。

消息放入发件箱以及发送过程是在同一个线程中进行

7、RpcAddress:表示远程的RpcEndpointRef的地址,Host + Port。

8、TransportClient:Netty通信客户端

一个 OutBox 对应一个 TransportClient,TransportClient 不断轮询OutBox,根据 OutBox 消息的 receiver 信息,请求对应的远程 TransportServer

原文地址:https://www.cnblogs.com/hyunbar/p/12079457.html

时间: 2024-08-30 13:26:49

Spark Netty 通信框架解析的相关文章

Spark1.6之后为何使用Netty通信框架替代Akka

解决方案: 一直以来,基于Akka实现的RPC通信框架是Spark引以为豪的主要特性,也是与Hadoop等分布式计算框架对比过程中一大亮点. 但是时代和技术都在演化,从Spark1.3.1版本开始,为了解决大块数据(如Shuffle)的传输问题,Spark引入了Netty通信框架,到了1.6.0版本,Netty居然完成取代了Akka,承担Spark内部所有的RPC通信以及数据流传输. 网络IO扫盲贴 在Linux操作系统层面,网络操作即为IO操作,总共有:阻塞式,非阻塞式,复用模型,信号驱动和异

Spark技术内幕:Client,Master和Worker 通信源代码解析

Spark的Cluster Manager能够有几种部署模式: Standlone Mesos YARN EC2 Local 在向集群提交计算任务后,系统的运算模型就是Driver Program定义的SparkContext向APP Master提交,有APP Master进行计算资源的调度并终于完毕计算.具体阐述能够阅读<Spark:大数据的电花火石!>. 那么Standalone模式下,Client.Master和Worker是怎样进行通信,注冊并开启服务的呢? 1. node之间的RP

HP-SOCKET TCP/UDP通信框架库解析

项目概述: HP-SOCKET是一套通用TCP/UDP通信框架,包括服务器.客户端.Agent组件:其目标是提供高性能.通用性.简易性.可扩展.可定制: 鉴于此,其仅实现基本的通用框架通信.数据收发功能,供上层应用直接简单使用的接口实现:而对于数据包完整性和协议解析等未处理, 也就意味着需要应用层自己处理一些数据包构造或解析等操作: 事实上目前只能支持windows平台: 1. 对于TCP通信模式下:服务器端和Agent均采用的是异步IO模型中的完成端口模型,客户端采用的是就绪IO通告模型中的W

NetworkComms c#通信框架与Java的Netty框架通信 解决粘包问题

上次写了一篇文章  基于networkcomms V3通信框架的c#服务器与java客户端进行通信之Protobuf探讨 其中没有解决粘包问题,抛砖引玉,文章得到了失足程序员 老师的点评,并给出了解决方案:[最多评论]java netty socket库和自定义C#socket库利用protobuf进行通信完整实例(10/591) » 于是马上开始学习,并把c#服务器端换成了我比较熟悉的networkcomms v3 c#通信框架(商业版,本文并不提供) ,以方便与已经存在的系统进行整合. 客户

选择Netty作为基础通信框架 .

在开始之前,我先讲一个亲身经历的故事:曾经有两个项目组同时用到了NIO编程技术,一个项目组选择自己开发NIO服务端,直接使用JDK原生的API,结果两个多月过去了,他们的NIO服务端始终无法稳定,问题频出.由于NIO通信是它们的核心组件之一,因此项目的进度受到了严重的影响.另一个项目组直接使用Netty作为NIO服务端,业务的定制开发工作量非常小,测试表明,功能和性能都完全达标,项目组几乎没有在NIO服务端上花费额外的时间和精力,项目进展也非常顺利. 这两个项目组的不同遭遇告诉我们:开发出高质量

高性能NIO通信框架之Netty入门(一)

一.不选择Java原生NIO编程的原因(1)NIO的类库和API复杂,使用麻烦,你需要熟练掌握Selector.ServerSocketChannel.SocketChannel.ByteBuffer等(2)需要具备其他的额外技能做铺垫,例如熟悉Java多线程编程.这是因为NIO编程涉及到Reactor模式,你必须对多线程和网络编程非常熟悉,才能编写出高质量NIO程序.(3)可靠性能力补齐,工作量和难度都非常大.例如客户端面临断链重连.网络闪断.半包读写.失败缓存.网络拥塞和异常码流的处理等问题

【Netty】最透彻的Netty原理架构解析

这可能是目前最透彻的Netty原理架构解析 本文基于 Netty 4.1 展开介绍相关理论模型,使用场景,基本组件.整体架构,知其然且知其所以然,希望给大家在实际开发实践.学习开源项目方面提供参考. Netty 是一个异步事件驱动的网络应用程序框架,用于快速开发可维护的高性能协议服务器和客户端. JDK 原生 NIO 程序的问题 JDK 原生也有一套网络应用程序 API,但是存在一系列问题,主要如下: NIO 的类库和 API 繁杂,使用麻烦.你需要熟练掌握 Selector.ServerSoc

Spark消息通信原理(一)——Spark消息通信架构

在Spark中定义了通信框架的接口,这些接口中调用了Netty的具体方法(在spark2.x前,使用的是Akka).各接口和实现类的关系如下图所示. 将终端(EndPoint)注册到Rpc环境中: 在各个模块中,如DriverEndPoint.ClientEndPoint.Master.Worker等,会先使用RpcEnv的静态方法创建RpcEnv实例,然后实例化终端,由于终端都是继承与ThreadSafeEpcEndPoint,即创建的终端实例属于线程安全的,接着调用RpcEnv的启动终端方法

(一)FlexViewer之整体框架解析

1.FlexViewer简介 FlexViewer框架为Esri提供的可以高效开发基于WEB的地理信息应用系统的一种完全免费的应用程序框架.目前有两种版本,一种是针对非开发人员的版 本,即编译后的发布(release)版本:一种是供开发人员在源框架的基础上,通过修改代码和配置文件等,来实现定制业务. 这里我要跟大家一起探讨的是面向开发人员的FlexViewer版本. 2.FlexViewer框架的组成 当我们从网上下载到FlexViewer的源码,通过eclipse加载后便可以看到该框架的组成结