select,poll,epoll都是IO多路复用的机制。I/O多路复用就通过一种机制,可以监视多个描述符,一旦某个描述符就绪(一般是读就绪或者写就绪),能够通知程序进行相应的读写操作
但select,poll,epoll本质上都是同步I/O,因为他们都需要在读写事件就绪后自己负责进行读写,也就是说这个读写过程是阻塞的,而异步I/O则无需自己负责进行读写,异步I/O的实现会负责把数据从内核拷贝到用户空间
三组IO复用函数的比较
select:
select系统调用的用途是:在一段指定时间内,监听用户所感兴趣的文件描述符上的可读、可写和异常事件
缺点:
1.所能监视的文件描述符的数量有限制,sizeof(fd_set)=128,说明能监视的描述符的最大值为128*8=1024个
2.同时每次调用select都需要在内核遍历传递进来的所有fd,当fd很多时性能会下降
3.由于当有事件发生时,select返回后会修改三个事件集,所以,每次都需要把fd集合从用户区拷贝到内核区,当需要监视的fd数量增多时,性能会下降
适用场景:
适用于所监视的文件描述符数量较少的场景
poll:
poll系统调用和select类似,也是在制定时间内轮询一定数量的文件描述符,以测试其中是否有就绪的文件描述符
优点:
1.相比select来讲,它没有fd数量的限制,理论上打开fd的数目跟系统内在有关
2.也不用每次都把fd集合从用户区拷贝数据到内核,它使用一个 struct pollfd结构体来维护每个fd
缺点:
它本质上是和selece一样的,只是描述fd集合的方式不同,poll使用pollfd结构而不是select的fd_set结构,其他的都差不多
适用场景:
也适用于所监视文件描述符少的场景
epoll:
epoll是Linux特有的IO复用函数,被认为性能最好的一种方法,
它和select、poll在实现和使用上有很大差异:
1.使用一组函数来完成,而不是单个
2. 把用户关心的文件描述符上的事件放在内核的一个事件表中,无须向select、poll那样每次调用都要重复传入文件描述符集或事件集,但epoll需要用一个额外的文件描述符来表示内核中的这个事件表
epoll函数非常简单,有epoll_create,epoll_ctl,epoll_wait3个函数,先使epoll_create创建一个epoll的句柄,再通过epoll_ctl注册事件,然后epoll_wait检测事件的发生
优点:
具备了select所不具备的所有优点
1.没有fd数量的限制,它所支持的fd上限是最大可以打开文件的数目,具体数目可cat/proc/sys/fs/file-max察看,一般来说这个数目和系统内存关系很大
2.epoll_ctl每次注册新的事件到epoll句柄中时(在epoll_ctl中指定EPOLL_CTL_ADD),会把所有的fd拷贝进内核,而不是在epoll_wait的时候重复拷贝,epoll保证了每个fd在整个过程中只会拷贝一次
3.epoll的解决方案不像select或poll一样每次都把current轮流加入fd对应的设备等待队列中,而只在epoll_ctl时把current挂一遍(这一遍必不可少)并为每个fd指定一个回调函数,当设备就绪,唤醒等待队列上的等待者时,就会调用这个回调函数,而这个回调函数会把就绪的fd加入一个就绪链表)。epoll_wait的工作实际上就是在这个就绪链表中查看有没有就绪的fd
适用场景:
当活动连接比较多的时候,epoll_wait的效率未必比select和poll高,因为此时回调函数被触发的过于频繁,因此epoll_wait适用于连接数量多,但活动连接较少的情况
epoll对文件描述符的操作有两种模式:LT和ET
LT(水平触发):这种模式是默认的工作模式,此时,epoll相当于效率较高的poll,
当往epoll内核事件表中注册一个文件描述符上的EPOLLET事件时,epoll将以ET模式来操作该文件描述符
ET(边沿触发):ET模式是epoll的高效工作模式,它在很大程度上降低了同一个epoll事件被重复触发的次数
总结:
这3组IO复用系统调用都能同时监听多个文件描述符,它们将等待由timeout参数指定的超时时间,直到一个或者多个文件描述符上有时间发生时返回,返回值就是就绪的文件描述符的数量,返回0表示没有事件发生。
这3组函数都通过某种结构体变量来告诉内核监听哪些文件描述符上的那些事件,并使用该结构体类型的参数来获取内核处理的结果。
select的参数类型fd_set,没有将文件描述符集合事件绑定,它仅仅是一个文件描述符集合,因此select需要提供3个这种类型的参数来分别传入和输出可读可写异常事件,这一方面使得select不能处理更多类型的事件,另一方面由于内核对fd_set集合的在线修改,应用程序下次调用select前不得不重置这3个fd_set集合。
poll的参数类型pollfd,它把文件描述符和事件都定义其中,任何事件都被统一处理,从而使编程接口简洁的多。并且内核每次修改的是pollfd结构体的revents成员,而events成员保持不变,因此下次调用poll时应用程序无须重置pollfd类型的事件集。
epoll使用一个独立的系统调用epoll_ctl来控制往其中添加、修改、删除事件。这样每次epoll_wait调用都直接从该内核事件表中取得用户注册的时间,而无须反复从用户空间读入这些事件,epoll_wait系统调用的events参数仅用来返回就绪的事件,这使得应用程序索引就绪文件描述符的时间复杂度达到O(1)。
poll和epoll_wait分别用nfds和maxevents参数指定最多监听多少个文件描述符和事件,这两个数值都能达到系统允许打开的最大文件描述符数目,我的系统下是48428
而select允许监听的文件描述符数量通常是有限的,测试结果为128*8=1024个
select和poll都只能工作在相对低效的LT模式下,而epoll则可以工作在ET高效模式,并且epoll还支持EPOLLONESHOT事件,该事件能进一步减少可读、可写和异常事件被触发的次数。
select采用的都是轮询的方式,即每次调用都要扫描整个注册文件描述符集合,epoll_wait采用的是回调的方式,内核检测到就绪的文件文件描述符时,将触发回调函数,回调函数就将该文件描述符上对应的事件插入内核就绪事件队列。内核最后在适当的时机将该就绪事件队列中的内容拷贝到用户空间,因此epoll无需轮询整个文件描述符集合来检测哪些事件已经就绪,当活动连接比较多的时候,epoll_wait的效率未必比select和poll高,因为此时回调函数被触发的过于频繁,因此epoll_wait适用于连接数量多,但活动连接较少的情况。
《完》