node.js的异步I/O、事件驱动、单线程 / 憋错料

nodejs的特点总共有以下几点

异步I/O(非阻塞I/O)
事件驱动
单线程
擅长I/O密集型，不擅长CPU密集型
高并发

下面是一道很经典的面试题,描述了node的整体运行机制，相信很多人都碰到了。这道题背后的原理就是nodejs代码执行顺序

    setTimeout(function() {
        console.log(‘4‘);
    },0)

    setImmediate(function() {
        console.log(‘5‘);
    })

    let s = new Promise(function(resolve, reject) {
        console.log(‘2‘);
        resolve(true)
        console.log(‘7‘)
    })

    s.then(function() {
        console.log(‘3‘);
    })

    process.nextTick(function() {
        console.log(‘6‘)
    })

    console.log(‘1‘);
    // 我电脑的输出结果是 2、7、1、6、3、4、5

1. nodejs代码执行顺序(事件循环机制)

nodejs的运行机制: nodejs主线程主要起一个任务调度的作用。nodejs用一个主线程处理所有的请求, 将I/O操作交由底下的线程池处理;在所有主线程任务执行完成后,主线程处理事件队列。所以在同步初始化代码执行完成后,nodejs会基于事件队列不停的做事件循环。事实上，nodejs运行环境 = 主线程(单线程,包括事件队列) + 线程池(工作线程池,执行其他工作-多线程)

node 的初始化
- 初始化 node 环境。
- 执行输入代码。
- 执行 process.nextTick 回调。
- 执行 microtasks。(Promise.then)
进入事件循环
- 进入 timers 阶段 (定时器阶段：本阶段执行已经安排的 setTimeout() 和 setInterval() 的回调函数。)
  - 检查 timer 队列是否有到期的 timer 回调，如果有，将到期的 timer 回调按照 timerId 升序执行。
  - 检查是否有 process.nextTick 任务，如果有，全部执行。
  - 检查是否有microtask，如果有，全部执行。
  - 退出该阶段。
- 进入pending IO callbacks阶段。(对某些系统操作（如 TCP 错误类型）执行回调)
  - 检查是否有 pending 的 I/O 回调。如果有，执行回调。如果没有，退出该阶段。
  - 检查是否有 process.nextTick 任务，如果有，全部执行。
  - 检查是否有microtask，如果有，全部执行。
  - 退出该阶段。
- 进入 idle，prepare 阶段：
  - 仅系统内部使用。
- 进入 poll 阶段(检索新的 I/O 事件;执行与 I/O 相关的回调，除了定时器和关闭的回调函数,其余都在这里)
  - 首先检查是否存在尚未完成的回调，如果存在，那么分两种情况。
    - 第一种情况：
      - 如果有可用回调（可用回调包含到期的定时器还有一些IO事件等），执行所有可用回调。
      - 检查是否有 process.nextTick 回调，如果有，全部执行。
      - 检查是否有 microtaks，如果有，全部执行。
      - 退出该阶段。
    - 第二种情况：
      - 如果没有可用回调,执行下一步;
      - 检查是否有 immediate 回调，如果有，退出 poll 阶段。如果没有，阻塞在此阶段，等待新的事件通知。
      - 如果不存在尚未完成的回调，退出poll阶段。
- 进入 check 阶段。(setImmediate() 回调函数在这里执行)
  - 如果有immediate回调，则执行所有immediate回调。
  - 检查是否有 process.nextTick 回调，如果有，全部执行。
  - 检查是否有 microtaks，如果有，全部执行。
  - 退出 check 阶段
- 进入 closing 阶段。(检测关闭的回调函数，例如 xx.on(‘close‘))
  - 如果有immediate回调，则执行所有immediate回调。
  - 检查是否有 process.nextTick 回调，如果有，全部执行。
  - 检查是否有 microtaks，如果有，全部执行。
  - 退出 closing 阶段
    - 检查是否有活跃的 handles（定时器、IO等事件句柄）。
      - 如果有，继续下一轮循环。
      - 如果没有，结束事件循环，退出程序。

注: 在主线程执行完和事件循环总共7个阶段，每一个阶段执行完都会调用一遍process.nextTick回调，一遍microtaks(promise);

2. setImmediate和process.nextTick和setTimeout

setImmediate(): 事件循环poll阶段执行完后执行setImmediate;
process.nextTick():主线程和事件循环每一阶段完成后都会调用;
setTimeout(): 最少经过n毫秒后执行的脚本，受到前一次事件循环时间影响，实际执行时间为>=n毫秒
** setTimeout和setImmediate执行顺序问题**
- 如果运行的是不属于 I/O 周期（即主模块）的以下脚本，则执行两个计时器的顺序是非确定性的，因为它受进程性能的约束;
- 如果你把这两个函数放入一个 I/O 循环内调用，setImmediate 总是被优先调用;I/O场景推荐使用setsetImmediate,因为setsetImmediate始终而且是立即执行

3. 对上题的理解

主线程中,console.log和promise的new方法在初始化主线程中执行,他们俩个的输出时间按照先上后下的顺序输出,他们两个执行完后会立即执行主线程的process.nextTick,然后执行promise.then方法,然后是进入事件队列中执行setTimeout和setImmediate。因为setTimeout的

‘最少经过n毫秒后执行的脚本‘特性,导致无法确定setTimeout和setImmediate的执行先后顺序,但如果是在回调函数中，则必然setImmediate先执行,因为事件循环的阶段中,setImmediate紧挨着回调函数之后执行,而setTimeout则在下次事件循环中执行。

4. 单线程和多线程

多线程: 服务器为每个客户端请求分配一个线程，使用同步 I/O，系统通过线程切换来弥补同步 I/O 调用的时间开销。比如 Apache 就是这种策略，由于 I/O 一般都是耗时操作，因此这种策略很难实现高性能，但非常简单，可以实现复杂的交互逻辑。
单线程: 而事实上，大多数网站的服务器端都不会做太多的计算，它们接收到请求以后，把请求交给其它服务来处理（比如读取数据库），然后等着结果返回，最后再把结果发给客户端。因此，Node.js 针对这一事实采用了单线程模型来处理，它不会为每个接入请求分配一个线程，而是用一个主线程处理所有的请求，然后对 I/O 操作进行异步处理，避开了创建、销毁线程以及在线程间切换所需的开销和复杂性。

5. 异步I/O

IO操作: IO操作就是以流的形式，进行的操作，比如网络请求，文件读取写入。IO操作也就是input和output的操作。
阻塞IO: 在调用阻塞O时，应用程序需要等待IO完成才能返回结果。阻塞IO的特点：调用之后一定要等到系统内核层面完成所有操作之后，调用才结束。阻塞O造成CUP等待IO，浪费等待时间，CPU的处理能力不能得到充分利用。
非阻塞IO: 为了提高性能，内核提供了非阻塞IO，非阻塞IO跟阻塞IO的差别是调用之后会立即返回。阻塞IO完成整个获取数据的过程，而非阻塞IO则不带数据直接返回，要获取数据，还要通过描述符再次读取。非阻塞IO返回之前，node主线程可以用来处理其他事物，此时性能提升非常明显。
为什么node擅长I/O密集型，不擅长CPU密集型:因为node的I/O处理中主线程只负责转发,实际操作在其他线程及线程队列里完成,所以性能相对较高; 而CPU密集则要求node的主线程处理，这时候其余请求只能等待
我的理解: node的异步I/O分为两个阶段,第一个阶段是主线程调用线程池里的工作线程执行异步操作，主线程取回对应的描述符,存储下来,工作线程执行相关操作取回数据后存储下来,这一部分在主线程接收到请求后立即完成;第二个阶段在事件队列里完成,根据描述符去工作线程里去获取数据,以提升性能.

6. 高并发

以下是对nodejs高并发的理解,nodejs的高并发体现在处理I/O的性能上，而不是CPU密集上,摘录自官网文档

让我们思考这样一种情况：每个对 Web 服务器的请求需要 50 毫秒完成，而那 50 毫秒中的 45 毫秒是可以异步执行的数据库 I/O。选择非阻塞异步操作可以释放每个请求的 45 毫秒来处理其它请求。仅仅是选择使用非阻塞方法而不是阻塞方法，就是容量上的重大区别。

7. 总结

Node 有两种类型的线程：一个事件循环线程和 k 个工作线程。事件循环负责 JavaScript 回调和非阻塞 I/O，工作线程执行与 C++ 代码对应的、完成异步请求的任务，包括阻塞 I/O 和 CPU 密集型工作。这两种类型的线程一次都只能处理一个活动。如果任意一个回调或任务需要很长时间，则运行它的线程将被阻塞。如果你的应用程序发起阻塞的回调或任务，在好的情况下这可能只会导致吞吐量下降（客户端/秒），而在最坏情况下可能会导致完全拒绝服务。要编写高吞吐量、防 DoS 攻击的 web 服务，您必须确保不管在良性或恶意输入的情况下，您的事件循环线程和您的工作线程都不会阻塞。

通常意义上,I/O密集型活动,如网络I/O、文件I/O，DNS操作等通常建议放在对外提供网络服务的端口所在的服务内,剩下的诸如大内容的crypto，zlib,fs同步操作、子进程，JSON处理、计算等尽量另起node服务或者其他语言服务去进行,因为这些操作会影响到node的主线程的性能和安全性。

参考

题外话

事实上,对于nodejs的相关理解更多的收获在于这里,nodejs官网指南的中文文档，以前有点粗心了

原文地址：https://www.cnblogs.com/zhaowinter/p/11138555.html

时间： 2024-10-23 03:00:29

node.js的异步I/O、事件驱动、单线程

1. nodejs代码执行顺序(事件循环机制)

2. setImmediate和process.nextTick和setTimeout

3. 对上题的理解

4. 单线程和多线程

5. 异步I/O

6. 高并发

7. 总结

参考

题外话

node.js的异步I/O、事件驱动、单线程的相关文章

【译】深入理解python3.4中Asyncio库与Node.js的异步IO机制

Node.js的异步I/O

对Node.js的异步机制的思考

node.js 多异步之间的协作方案

node.js接收异步任务结果的两种方法----callback和事件广播

浅谈Node.js单线程模型

【转】浅谈Node.js单线程模型

Node.js入门：异步IO

Node.js学习笔记（2）——关于异步编程风格