为什么IO模式非常重要?由于现代的计算机和操作系统的架构决定了CPU是稀缺资源,大家都要来一起竞争。而IO(特别是网络相关的IO)的速度往往较慢。所以怎样进行IO就有了多种模式,包含同步、异步、堵塞、非堵塞等等。
不少人把这几个概念放到一起讨论,非常多时候也难以区分。
这里从根上剖析下该怎么看待这几个概念。
首先。异步和同步是相对的,而同步情况下又有堵塞和非堵塞之分。
异步非常easy理解。当用户程序须要进行IO的时候,发出IO请求,然后就立马返回。能够继续做其他事情。
比如。从网络收包,当包抵达后放到内核某个缓存区,而且从内核空间放置到程序须要的用户空间后(一种是直接复制。比較费资源;一种是映射mmap),通知程序,程序之后就能够处理数据了。
这是最理想的模式。CPU干活效率最高。
同步情况则是,当用户程序须要进行IO的时候,发出IO请求。然后就等着数据到达后进行处理(首先将数据从内核空间拷贝到用户空间,然后进行操作)。
详细怎么等呢?一种就是堵塞在那里。CPU就处理其他的程序去了;一种就是发现没有数据就返回一个错误,程序能够干点别的事情(一般是不断轮询)。过会还得自动回来看看数据OK了么。
同步情况下显然效率比較差,于是有了各种技术来改进它,一种就是IO多路复用(用一个专门的线程来负责IO)。包含Linux上的select、poll和epoll。
select和poll类似,都是用一个内核优化线程来不断轮询IO,一旦有数据了用户程序就能够利用系统调用将数据从内核空间拷贝到用户空间。之后进行处理。这尽管提高了效率,但事实上仍然是一种同步模式。
epoll则更进一步。採用了底层的notify机制和mmap,底层数据可用后通知IO线程,并利用mmap将数据直接映射到用户空间。
此时用户程序能够直接对数据进行操作了。