服务器端网络编程之线程模型

  上一篇文章《服务器端网络编程之 IO 模型》中讲到服务器端高性能网络编程的核心在于架构,而架构的核心在于进程-线程模型的选择。本文将主要介绍传统的和目前流行的进程-线程模型,在讲进程-线程程模型之前需要先介绍一种设计模式: Reactor 模式,不明白的看这里《设计模式详解》,文中有一句话对 Reactor 模式总结的很好,引用下。

  Reactor 模式首先是事件驱动的,有一个或多个并发输入源,有一个Service Handler,有多个Request Handlers;这个Service Handler会同步的将输入的请求(Event)多路复用的分发给相应的Request Handler。如果用图表示的如下:

?

  不知道读者有没有发现 Reactor 模式跟 IO 模型中的 IO 多路复用模型非常相似 ,在学习网络编程过程中也被这两个概念迷惑了很久。其实在设计模式层面 IO 多路复用也是采用 Reactor 模式的。IO 多路复用模型可以看成是 Reactor 模式在 IO 模型上的应用,而今天我们要讲的是 Reactor 模式在进程-线程模型上的应用。

  在我的看来,进程-线程模型可以分为非 Reactor 模式和 Reactor 模式两种(当然还有 Proactor 模式,这种本文先不讲,因为使用的比较少,而且我也还没搞懂这种模式)。非 Reactor 模式和 Reactor 模式的两种进程-线程模型下具体又分很多种,后面会一一列举。非 Reactor 模式的进程-线程模型是传统的模型,现在已经很少见,放在这里主要是让读者做个了解同时与 Reactor 模式的进程-线程模式做个对比。

非 Reactor 模式的进程-线程模型

  传统模型不使用 IO 多路使用,所以问题比较多。初学者建议看下这部分,如果你觉得被迷糊了或者不感兴趣可以跳过该部分,直接看 Reactor 模式的部分即可。但该部分的第 1、2 点需要了解下。

1、单进程单线程:

?

  描述:这种模型所有的逻辑都在在一个进程中,包括建立连接->Read 连接上的数据->业务处理->Write 回一些数据然后一直循环下去。该模型一次只能处理一个连接,这个在真正的应用中是没有的。初学者在模仿《Unix网络编程卷 I》例子编写网络程序时应该会使用这种模型,当然例子中一般会在 Write 后面多个 Close 连接的动作,以免在处理下一个连接的时候造成前一个句柄泄露。

  优点:代码简单,无需去了解进程、线程的概念,适合学习网络编程的初学者。在不了解进程-线程模型情况下的默认模型。

  缺点:没有任何实用价值。

  2、单进程多线程

?

  描述:进程只做建立连接的动作,每接收一个连接就创建一个线程,在此连接上的读->业务处理->写->关闭连接都在线程中去做,可以采用线程池的方式减少线程的创建和销毁。这种线程模型有一定的应用场景,Tomcat 三种线程模型之 BIO 用的就是这种进程-线程模型。初学者在学习完单进程单线程模型后对线程有所了解即可开始学习该种模型,可以实现一个简单的聊天室程序。

  优点:可以同时与多个 Client 建立连接,接收连接和处理连接业务分开。

  缺点:每个连接占用一个线程,当连接上没有数据的时候造成线程资源浪费,可以建立的连接数比较有限。

  3、多进程单线程

?

  描述:

  (1) 主进程启动时创建监听套接字并监听,然后 fork 出 N 个子进程。

  (2) 由于父子进程的继承性,子进程同时也在端口监听,然后在父进程中关闭监听。

  (3) 父进程负责子进程的创建、销毁、资源回收等,子进程负责连接的建立->Read->业务处理->Write 等。

  由于所有进程都在同一个端口监听,该模型会出现一个比较知名的现象---惊群现象:当有一个连接来临时,所有子进程都会被唤醒,但是最后能与 Client 建立连接的只有一个,造成资源浪费(系通调度也是消耗 CPU 的)。不过 linux 2.6 版本以后已经在内核消除了惊群,当有连接来临只会唤醒一个等待在 accept() 上的进程。即使内核没修复,在应用层也可以用锁的方式防止惊群。

  缺点:这种模型是单进程单线程的进化版本,然而并没有什么卵用。且增加了开发的难度。所以不列出它的优点,介绍这种模型主要是引出惊群的概念,在后面的 Reactor 模型中的多进程情况下也会出现类似的情况。

Reactor 模式的进程-线程模型

  该模式一般是 Reactor 模型 + IO 多路复用,下面的任何一种模型都具有一定的实用场景。

  1、单进程单线程:

?

  描述:只有一个进程,监听套接字和连接套接字上的事件都由 Select 来处理,

  (1) 如果有建立连接的请求过来,Acceptor 负责接受并与之建立连接,同时将连接套接字加入 Select 进行监听;

  (2) 如果某个连接上有读事件则进行 Read->业务处理->Write 等操作;

  (3) 如此循环反复。

  优点:编程简单,对于业务处理不复杂的后台,基本能满足服务器端网络编程。老东家的服务器端程序全是这种模式,主要原因有如下原因

  (1) 如果一台机器性能不行,那就向集群中新增一台。

  (2) 业务处理并不复杂。

  (3) 扩展成多进程的话,如果不是多核意义不大。

  (4) 如果采用单进程多线程,C++ 处理线程不像 Java 简单,还要考虑并发的问题,收益比不大。

  缺点:会有阻塞,在进行业务处理的时候不能进行其他操作:如建立连接,读取其他套接字上的数据等。

  2、单进程多线程:

?

  描述:与单进程单线程类似,不同的是该模型将业务处理放在线程中,进程就不会阻塞在业务处理上。

  优点:比较完美的进程-线程模型,在 Java 实现中复杂度也不高。很多网络库都是基于此,比如 Netty 。

  缺点:待补充。

  3、多进程单线程:

?

  描述:与非 Reactor 模式中的多进程单线程相似,只是本模式在子进程中使用了 IO 多路复用,实用性以下就上来了。大名鼎鼎的 nginx 就采用这种进程-线程模型

  优点:编程相对简单,充分利用多核。能满足高并发,不然 nginx 也不可能采用这种模式。

  缺点:子进程还是会阻塞在业务处理上。

  4、多进程多线程

  描述:这里不再画出图形,就是在在子进程上将业务处理交给多线程处理,参考单进程多线程里的线程池那里。

  优点:充分利用多核同时子进程不会阻塞在业务处理上

  缺点:编程复杂。

  5、主从进程 +多线程:

?

  描述:前面几种 Reactor 模式的进程-线程模型中,连接的建立和连接的读写都是在同一进程中。本模型中将连接的建立和连接读写放在不同的进程中。

  (1) 主进程在监听套接字上 Select 阻塞,一旦有请求过来则与之建立连接,并将连接套接字传递给从进程。

  (2) 从进程在连接套接字上 Select 阻塞,一旦连接上有数据过来则进行 Read,并将业务处理通过线程来处理。如果有必要还会向连接 Write 数据。

  优点:连接的建立和连接的读写分开在不同进程中,处理效率会更高。该模型比单进程多线程模式还更优一点,且也可以利用多核。

  缺点:编程复杂。

  以上就是常见的进程-线程模型,使用了 IO 多路复用的线程模型一般都可以称为 Reactor 模型,所以不用纠结 IO 多路复用与 Reactor 模式之间的关系。由 C++ 转 Java 后,虽然不再从事网咯编程。但是在看完《Netty 权威指南》后又想结合之前的工作经验讲讲一个网络库设计需要考虑的一些要素,同时做一些 Netty 的分享。在后续的文章中会出,敬请期待!记得关注下哦~

原文地址:https://www.cnblogs.com/zhuwbox/p/10416087.html

时间: 2024-10-12 17:47:33

服务器端网络编程之线程模型的相关文章

高性能服务器端网络编程模型

上一篇文章<Java 程序员也需要了解的 IO 模型>中讲到服务器端高性能网络编程的核心在于架构,而架构的核心在于进程-线程模型的选择.本文将主要介绍传统的和目前流行的进程-线程模型,在讲进程-线程程模型之前需要先介绍一种设计模式: Reactor 模式,不明白的看这里<设计模式详解>,文中有一句话对 Reactor 模式总结的很好,引用下. Reactor 模式首先是事件驱动的,有一个或多个并发输入源,有一个Service Handler,有多个Request Handlers:

python网络编程基础(线程与进程、并行与并发、同步与异步)

python网络编程基础(线程与进程.并行与并发.同步与异步) 目录 线程与进程 并行与并发 同步与异步 线程与进程 进程 前言 进程的出现是为了更好的利用CPU资源使到并发成为可能. 假设有两个任务A和B,当A遇到IO操作,CPU默默的等待任务A读取完操作再去执行任务B,这样无疑是对CPU资源的极大的浪费.聪明的老大们就在想若在任务A读取数据时,让任务B执行,当任务A读取完数据后,再切换到任务A执行.注意关键字切换,自然是切换,那么这就涉及到了状态的保存,状态的恢复,加上任务A与任务B所需要的

Unix 网络编程 I/O 模型 第六章

前提,也是重点是, 当接收收据.或者读取数据时,分两步 1 等待数据准备好. 2 从内核拷贝数据到进程. 对于一个network IO 即 socket(这里我们以read举例),它会涉及到两个系统对象,一个是调用这个IO的process (or thread),另一个就是系统内核(kernel).当一个read操作发生时,它会经历两个阶段: 1 等待数据准备 (Waiting for the data to be ready) 2 将数据从内核拷贝到进程中 (Copying the data

也谈服务器端网络编程

这里主要说一下自己看的书和一些心得体会,把自己的学习路线梳理一下,也是作为自己这段时间的学习总结. 因为从事的都是服务器端开发和学习,所以本文内容主要在该范围内,假定读者经过了系统的CS学习(DS.OS.组成原理等核心课程). First,我的学习书籍路线参考如下内容: 1 A:<Linux鸟哥私房菜>(第三版): 2 3 B:<Linux程序设计>(第四版 中文版): 4 5 C:<TCP/IP详解v1>(英文版): 6 7 D:C/C++语言相关: 8 9 E:&l

《网络编程》线程

线程基本函数 当一个程序被启动时,只有一个主线程,若要实现对其他线程的基本操作,首先必须创建新的线程,新的线程创建可以使用 pthread_create 函数实现,该函数的 API 定义如下: /* 函数功能:创建新的线程: * 返回值:若成功则返回0,若出错则返回正的错误码: * 函数原型: */ #include <pthread.h> int pthread_create(pthread_t *tid, const pthread_attr_t *attr, void*(*func)(v

py2/py3区别, 列表生成式, 网络编程, socketserver, 线程, uuid模块

一. py2/py3区别    - 编码&字符串        字符串:            py2:                unicode         v = u"root"    本质上用unicode存储(万国码)                (str/bytes)     v = "root"     本质用字节存储            py3:                str                v = "

day33 网络编程之线程,并发

概要: 1 并发编程需要掌握的知识点: 2 开启进程/线程 3 生产者消费者模型!!! 4 GIL全局解释器锁(进程与线程的区别和应用场景) 5 进程池线程池 6 7 IO模型(理论) 8 9 10 1 多线程 11 线程的概念? 12 一个进程内默认就会有一个控制线程,该控制线程可以执行代码从而创建新的线程 13 该控制线程的执行周期就代表改进程的执行周期 14 线程VS进程 15 1.线程的创建开销小于进程,创建速度快 16 2.同一进程下的多个线程共享该进程的地址空间 17 GIL全局解释

Python网络编程(OSI模型、网络协议、TCP)

前言: 什么是网络? 网络是由节点和连线构成,表示诸多对象及其相互联系. 在数学上,网络是一种图,一般认为专指加权图. 网络除了数学定义外,还有具体的物理含义,即网络是从某种相同类 型的实际问题中抽象出来的模型 在计算机领域中,网络是信息传输.接收.共享的虚拟平台,通过它把各个点.面.体的信息联系到一起,从而实现这些资源的共享. 网络是人类发展史来最重要的发明,提高了科技和人类社会的发展. 在1999年之前,人们一般认为网络的结构都是随机的.但随着Barabasi和Watts在1999年分别发现

Python网络编程之线程与进程

What is a Thread? 线程是操作系统能够进行运算调度的最小单位,它被包含在进程之中,是进程中的实际运作单位,一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务. 在同一个进程内的线程的数据是可以进行互相访问的. 线程的切换使用过上下文来实现的,比如有一本书,有a和b这两个人(两个线程)看,a看完之后记录当前看到那一页哪一行,然后交给b看,b看完之后记录当前看到了那一页哪一行,此时a又要看了,那么a就通过上次记录的值(上下文)直接找到上次