IO复用是Linux中的IO模型之中的一个,IO复用就是进程预先告诉内核须要监视的IO条件,使得内核一旦发现进程指定的一个或多个IO条件就绪,就通过进程进程处理。从而不会在单个IO上堵塞了。
Linux中。提供了select、poll、epoll三种接口函数来实现IO复用。
1、select函数
#include <sys/select.h> #include <sys/time.h> int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout); 返回:若有就绪描写叙述符则为其个数,超时为0,出错-1
nfds參数指定了被监听文件描写叙述符的个数,通常设置为监听的全部描写叙述符最大值加1,由于文件描写叙述符是从0開始的。
readfs、writefds和exceptfds分别相应可读、可写和异常等事件文件描写叙述符集合。当调用select时,通过这3个參数传入自己感兴趣的文件描写叙述符,select函数返回后,内核通过改动他们来通知应用程序那些文件描写叙述符已经就绪。
fd_set结构体包括一个整形数组,该数组中每个元素的每一位标记一个文件描写叙述符,fd_set容纳的文件描写叙述符数量由FD_SETSIZE指定,这就限制了select能同一时候处理的文件描写叙述符最大个数。
通过一些宏来操作fd_set结构体中的位:
#include <sys/select.h> FD_ZERO(fd_set *fdset); /* 清除fdset全部标志位 */ FD_SET(int fd, fd_set fdset); /* 设置fdset标志位fd */ FD_CLR(int fd, fd_set fdset); /* 清除fdset标志位fd */ int FD_ISSET(int fd, fd_set *fdset); /* 測试fdset的位fd是否被设置 */
timeout參数用来设置select的超时时间。它是一个timeval结构类型指针,採用指针參数是应为内核将改动它以告诉应用程序select等待了多久。
只是我们不能全然信任select调用返回的timeout值。比方调用失败后timeout的值是不确定的。
struct timeval { long tv_sec; //秒数 long tv_usec; //微秒数 };
select提供了一个微妙的定时方案,假设给timeval的成员都赋值0,则select将马上返回。假设timeout为NULL,则select将一直堵塞,直到某个文件描写叙述符就绪。
select成功时返回就绪的文件描写叙述符的总数,假设在超时时间内没有不论什么描写叙述符就绪,select返回0,select失败返回-1并设置errno。假设在select等待期间。程序收到信号。则select马上返回-1,并设置errno为EINTR。
select缺点:
l 每次调用select。都须要把fd集合从用户态复制到内核态,这个开销在fd非常多时会非常大
l 每次调用select都须要在内核遍历传递进来的全部fd,这个开销在fd非常多时也非常大
l select支持的文件描写叙述符数量太小了,默认是1024
/** * select測试用例 */ #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <sys/socket.h> #include <sys/select.h> #include <netinet/in.h> #include <arpa/inet.h> #include <string.h> #define err_sys(msg) do { perror(msg); exit(-1); } while(0) #define err_exit(msg) do {fprintf(stderr, msg); exit(-1); } while(0) #define err_info(msg) do { fprintf(stderr, msg); } while(0) int main(int argc, char *argv[]) { if(argc != 3) err_exit("usage: ./a.out ip port.\n"); int port = atoi(argv[2]); int listenfd, connfd; struct sockaddr_in servaddr; if((listenfd = socket(AF_INET, SOCK_STREAM, 0)) < 0) err_sys("socket"); bzero(&servaddr, sizeof(servaddr)); servaddr.sin_family = AF_INET; servaddr.sin_port = htons(port); if(inet_pton(AF_INET, argv[1], &servaddr.sin_addr) < 0) err_sys("inet_pton"); if(bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) err_sys("bind"); if(listen(listenfd, 5) < 0) err_sys("listenfd"); if((connfd = accept(listenfd, NULL, NULL)) < 0) err_sys("accept"); fd_set read_fd; fd_set except_fd; FD_ZERO(&read_fd); FD_ZERO(&except_fd); char buf[1024]; while(1) { memset(buf, 0, sizeof(buf)); /* 每次调用select前都要又一次在read_fd和except_fd中设置文件描写叙述浮connfd,由于事件发生后, * 文件描写叙述符集将被内核改动 */ FD_SET(connfd, &read_fd); FD_SET(connfd, &except_fd); if(select(connfd + 1, &read_fd, NULL, &except_fd, NULL) < 0) err_sys("select"); /* 对于可读事件。採用普通的recv函数读取数据 */ if(FD_ISSET(connfd, &read_fd)) { if(recv(connfd, buf, sizeof(buf) - 1, 0) < 0) { err_info("recv error\n"); continue; } if(!strcmp(buf, "exit")) { printf("I had got the exit, I will go out! bye!\n"); break; } else { printf("recv: %s\n", buf); } } /* 对于异常事件。採用带MSG_OOB标志的recv函数都去带外数据 */ if(FD_ISSET(connfd, &except_fd)) { if(recv(connfd, buf, sizeof(buf) - 1, MSG_OOB) < 0) { err_info("recv error\n"); continue; } printf("recv: %s\n", buf); } } close(connfd); close(listenfd); return 0; }
2、poll函数
#include <poll.h> int poll(struct pollfd *fds, nfds_t nfds, int timeout); 返回:若有就绪描写叙述符则为其数目,超时为0,出错-1
poll系统调用和select类似,也是在一定时间内轮询一定数量的文件描写叙述符,測试是否有就绪者。
nfds參数指定被监听事件集合fds的大小,timeout指定poll的超时值。单位为毫秒,当timeout为-1时。poll调用将一直堵塞,直到某个事件发生。当timeout为0时,poll调用立即返回。
pollfd结构体:
struct pollfd { int fd; /* 文件描写叙述符 */ short events; /* 注冊的事件 */ short revents; /* 实际发生的事件。有内核填充 */ };
poll支持的事件类型:
/** * poll測试用例,同一时候接收客户端发来的数据和从标准输入中读取数据 */ #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <sys/socket.h> #include <sys/poll.h> #include <netinet/in.h> #include <arpa/inet.h> #include <string.h> #define err_sys(msg) do { perror(msg); exit(-1); } while(0) #define err_exit(msg) do {fprintf(stderr, msg); exit(-1); } while(0) #define err_info(msg) do { fprintf(stderr, msg); } while(0) int main(int argc, char *argv[]) { if(argc != 3) err_exit("usage: ./a.out ip port.\n"); int port = atoi(argv[2]); int listenfd, connfd; struct sockaddr_in servaddr; if((listenfd = socket(AF_INET, SOCK_STREAM, 0)) < 0) err_sys("socket"); bzero(&servaddr, sizeof(servaddr)); servaddr.sin_family = AF_INET; servaddr.sin_port = htons(port); if(inet_pton(AF_INET, argv[1], &servaddr.sin_addr) < 0) err_sys("inet_pton"); if(bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) err_sys("bind"); if(listen(listenfd, 5) < 0) err_sys("listenfd"); if((connfd = accept(listenfd, NULL, NULL)) < 0) err_sys("accept"); struct pollfd poll_fd[2]; poll_fd[0].fd = connfd; poll_fd[0].events = POLLIN; poll_fd[1].fd = STDIN_FILENO; poll_fd[1].events = POLLIN; char buf[1024]; int runing = 1; #define MAXEVENTS 2 while(runing) { memset(buf, 0, sizeof(buf)); if(poll(poll_fd, MAXEVENTS, -1) < 0) err_sys("poll"); int i, sockfd, ret; for(i = 0; i < MAXEVENTS; i++) { if(poll_fd[i].revents & POLLIN) { sockfd = poll_fd[i].fd; if(sockfd == connfd) { if((ret = recv(sockfd, buf, sizeof(buf) - 1, 0)) <= 0) { if(ret < 0) err_info("recv error\n"); else { printf("The client host is terminal. I will go tou! Bye!!\n"); runing = 0; } } if(!strcmp(buf, "exit")) { printf("I had got the exit, I will go out! bye!\n"); runing = 0; } else { printf("recv: %s\n", buf); } } else if(sockfd == STDIN_FILENO) { scanf("%s", buf); if(send(connfd, buf, strlen(buf), 0) < 0) { err_info("send error"); } } } } } close(connfd); close(listenfd); return 0; }
3、epoll系列函数
epoll是Linux特有的IO复用函数,它在实现和使用上与select和poll有非常大差异,首先。epoll使用一组函数来完毕操作,而不是单个函数。
其次,epoll把用户关心的文件描写叙述符上的事件放在内核上的一个事件表中。从而无须像select和poll那样每次调用都要反复传入文件描写叙述符集合事件表。
但epoll须要使用一个额外的文件描写叙述符。来唯一标识内核中这个事件表,这个文件描写叙述符使用例如以下epoll_create函数创建
#include <sys/epoll.h> int epoll_create(int size); 返回:成功返回创建的内核事件表相应的描写叙述符,出错-1
size參数如今并不起作用,仅仅是给内核一个提示,告诉它内核表须要多大,该函数返回的文件描写叙述符将用作其它全部epoll函数的第一个參数。以指定要訪问的内核事件表。
用epoll_ctl函数操作内核事件表
#include <sys/epoll.h> int epoll_ctl(int opfd, int op, int fd, struct epoll_event *event);
返回:成功返回0。出错-1
fd參数是要操作的文件描写叙述符。op指定操作类型,操作类型有3种
l EPOLL_CTL_ADD:往事件表中注冊fd上的事件
l EPOLL_CTL_MOD:改动fd上的注冊事件
l EPOLL_CTL_DEL:删除fd上的注冊时间爱你
event指定事件类型。它是epoll_event结构指针类型
struct epoll_event { __uint32_t events; /* epoll事件 */ epoll_data_t data; /* 用户数据 */ };
当中events描写叙述事件类型,epoll支持的事件类型和poll基本同样。表示epoll事件类型的宏是在poll相应的宏加上”E”,比方epoll的数据可读事件是EPOLLIN。但epoll有两个额外的事件类型-EPOLLET和EPOLLONESHOT,它们对于高效运作很关键,data用于存储用户数据,其类型epoll_data_t定义例如以下:
typedef union epoll_data { void *ptr; int fd; uint32_t u32; uint64_t u64; }epoll_data_t;
epoll_data_t是一个联合体,其4个成员最多使用的是fd。它指定事件所从属的目标文件描写叙述符,ptr成员可用来指定fd相关的用户数据,但因为opoll_data_t是一个联合体。我们不能同一时候使用fd和ptr,假设要将文件描写叙述符嗯哼用户数据关联起来。以实现高速的数据訪问。则仅仅能使用其它手段,比方放弃使用fd成员,而在ptr指针指向的用户数据中包括fd
#include <sys/epoll.h> int epoll_wait(int epfd, struct epoll_event *events, int maxevents, int timeout); 返回:成功返回就绪的文件描写叙述符个数,出错-1
timeout參数的含义与poll接口的timeout參数同样,maxevents參数指定最多监听多少个事件。它必须大于0。
epoll_wait假设检測到事件,就将全部就绪的事件从内核事件表(由epfd指定)中拷贝到events指定的数组中。这个数组仅仅用来输epoll_wait检測到的就绪事件,而不像select和poll的參数数组既传递用于用户注冊的事件,实用于输出内核检測到就绪事件。这样极大提高了应用程序索引就绪文件描写叙述符的效率。
/** * epoll測试用例 * 当文件命名是io_epoll.c时,编译选项gcc io_epoll.c有错误,提示unknow type name epoll_event * 当把文件命名io_epoll.cpp时,编译选项gcc io_epoll.cpp或者g++ io_epoll.c就能够 */ #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <sys/types.h> #include <sys/socket.h> #include <sys/epoll.h> #include <netinet/in.h> #include <arpa/inet.h> #include <fcntl.h> #include <string.h> #define err_sys(msg) do { perror(msg); exit(-1); } while(0) #define err_exit(msg) do { fprintf(stderr, msg); exit(-1); } while(0) #define err_info(msg) do { fprintf(stderr, msg); } while(0) #define MAXEVENTS 5 void addfd(int epollfd, int fd) { epoll_event event; event.data.fd = fd; event.events = EPOLLIN; epoll_ctl(epollfd, EPOLL_CTL_ADD, fd, &event); } int main(int argc, char *argv[]) { if(argc != 2) err_exit("Usage: ./a.out port\n"); int port = atoi(argv[1]); int listenfd, connfd; struct sockaddr_in servaddr; bzero(&servaddr, sizeof(servaddr)); servaddr.sin_family = AF_INET; servaddr.sin_port = htons(port); servaddr.sin_addr.s_addr = htonl(INADDR_ANY); if((listenfd = socket(AF_INET, SOCK_STREAM, 0)) < 0) err_sys("socket"); if(bind(listenfd, (struct sockaddr *)&servaddr, sizeof(servaddr)) < 0) err_sys("bind"); if(listen(listenfd, 5) < 0) err_sys("listen"); epoll_event events[MAXEVENTS]; int epollfd; if((epollfd = epoll_create(5)) < 0) err_sys("epoll_create"); if((connfd = accept(listenfd, NULL, NULL)) < 0) err_sys("accept"); addfd(epollfd, connfd); addfd(epollfd, STDIN_FILENO); int runing = 1; while(runing) { int i, cnt = epoll_wait(epollfd, events, MAXEVENTS, -1); char buf[1024]; for(i = 0; i < cnt; i++) { int sockfd = events[i].data.fd; if(sockfd == STDIN_FILENO) { scanf("%s", buf); if(send(connfd, buf, strlen(buf), 0) < 0) { err_info("send error\n"); } } else if(sockfd == connfd) { int ret; bzero(buf, sizeof(buf)); if((ret = recv(sockfd, buf, sizeof(buf) - 1, 0)) <= 0) { if(ret < 0) err_info("recv error\n"); else { printf("The client host is termenal. I will go out! Bye!\n"); runing = 0; } } else if(!strcmp(buf, "exit")) { printf("I had got the 'exit', I will go out! Bye\n"); runing = 0; } else { printf("recv: %s\n", buf); } } } } close(connfd); close(listenfd); return 0; }
參考资料:
1、《linux高性能server编程》第9章 IO复用