慢系统调用(Slow system call)
该术语适用于那些可能永远阻塞的系统调用。永远阻塞的系统调用是指调用永远无法返回,多数网络支持函数都属于这一类。如:若没有客户连接到服务器上,那么服务器的accept调用就会一直阻塞。
慢系统调用可以被永久阻塞,包括以下几个类别:
(1)读写‘慢’设备(包括pipe,终端设备,网络连接等)。读时,数据不存在,需要等待;写时,缓冲区满或其他原因,需要等待。读写磁盘文件一般不会阻塞。
(2)当打开某些特殊文件时,需要等待某些条件,才能打开。例如:打开中断设备时,需要等到连接设备的modem响应才能完成。
(3)pause和wait函数。pause函数使调用进程睡眠,直到捕获到一个信号。wait等待子进程终止。
(4)某些ioctl操作。
(5)某些IPC操作。
早期的Unix系统,如果进程在一个慢系统调用(slow system call)中阻塞时,当捕获到某个信号且相应信号处理函数返回时,这个系统调用被中断,调用返回错误,设置errno为EINTR(相应的错误描述为“Interrupted system call”)。
一些IO系统调用执行时, 如 read 等待输入期间, 如果收到一个信号,系统将中断read, 转而执行信号处理函数. 当信号处理返回后, 系统遇到了一个问题: 是重新开始这个系统调用, 还是让系统调用失败?早期UNIX系统的做法是, 中断系统调用, 并让系统调用失败, 比如read返回 -1, 同时设置 errno 为 EINTR中断了的系统调用是没有完成的调用, 它的失败是临时性的, 如果再次调用则可能成功, 这并不是真正的失败, 所以要对这种情况进行处理, 典型的方式为:
1 while (1) { 2 3 n = read(fd, buf, BUFSIZ); 4 5 if (n == -1 && errno != EINTR) { 6 7 printf("read error\n"); 8 9 break; 10 11 } 12 13 if (n == 0) { 14 15 printf("read done\n"); 16 17 break; 18 19 } 20 21 }
这样做逻辑比较繁琐, 事实上, 我们可以从信号的角度来解决这个问题, 安装信号的时候, 设置 SA_RESTART属性, 那么当信号处理函数返回后, 被该信号中断的系统调用将自动恢复.
示例程序:
1 #include <signal.h> 2 #include <stdio.h> 3 #include <stdlib.h> 4 #include <error.h> 5 #include <string.h> 6 #include <unistd.h> 7 8 void sig_handler(int signum) 9 { 10 printf("in handler\n"); 11 sleep(1); 12 printf("handler return\n"); 13 } 14 15 int main(int argc, char **argv) 16 { 17 char buf[100]; 18 int ret; 19 struct sigaction action, old_action; 20 21 action.sa_handler = sig_handler; 22 sigemptyset(&action.sa_mask); 23 action.sa_flags = 0; 24 /* 版本1:不设置SA_RESTART属性 25 * 版本2:设置SA_RESTART属性 */ 26 //action.sa_flags |= SA_RESTART; 27 28 sigaction(SIGINT, NULL, &old_action); 29 if (old_action.sa_handler != SIG_IGN) { 30 sigaction(SIGINT, &action, NULL); 31 } 32 33 bzero(buf, 100); 34 35 ret = read(0, buf, 100); 36 if (ret == -1) { 37 perror("read"); 38 } 39 40 printf("read %d bytes:\n", ret); 41 printf("%s\n", buf); 42 43 return 0; 44 }
当sa_flags不设置:SA_RESTART时:
结果:
设置后:
当被中断后,重新执行
如何处理被中断的系统调用
既然系统调用会被中断,那么别忘了要处理被中断的系统调用。有三种处理方式:
◆ 人为重启被中断的系统调用
◆ 安装信号时设置 SA_RESTART属性(该方法对有的系统调用无效)
◆ 忽略信号(让系统不产生信号中断)
人为重启被中断的系统调用
人为当碰到EINTR错误的时候,有一些可以重启的系统调用要进行重启,而对于有一些系统调用是不能够重启的。例如:accept、read、write、select、和open之类的函数来说,是可以进行重启的。不过对于套接字编程中的connect函数我们是不能重启的,若connect函数返回一个EINTR错误的时候,我们不能再次调用它,否则将立即返回一个错误。针对connect不能重启的处理方法是,必须调用select来等待连接完成。
这里的“重启”怎么理解?
一些IO系统调用执行时,如 read 等待输入期间,如果收到一个信号,系统将中断read, 转而执行信号处理函数. 当信号处理返回后, 系统遇到了一个问题: 是重新开始这个系统调用, 还是让系统调用失败?早期UNIX系统的做法是, 中断系统调用,并让系统调用失败, 比如read返回 -1, 同时设置 errno 为EINTR中断了的系统调用是没有完成的调用,它的失败是临时性的,如果再次调用则可能成功,这并不是真正的失败,所以要对这种情况进行处理, 典型的方式为:
1 again: 2 if ((n = read(fd, buf, BUFFSIZE)) < 0) { 3 if (errno == EINTR) 4 goto again; /* just an interrupted system call */ 5 /* handle other errors */ 6 }
安装信号时设置 SA_RESTART属性
我们还可以从信号的角度来解决这个问题, 安装信号的时候, 设置 SA_RESTART属性,那么当信号处理函数返回后, 不会让系统调用返回失败,而是让被该信号中断的系统调用将自动恢复。
1 struct sigaction action; 2 3 action.sa_handler = handler_func; 4 sigemptyset(&action.sa_mask); 5 action.sa_flags = 0; 6 /* 设置SA_RESTART属性 */ 7 action.sa_flags |= SA_RESTART; 8 9 sigaction(SIGALRM, &action, NULL);
但注意,并不是所有的系统调用都可以自动恢复。如msgsnd喝msgrcv就是典型的例子,msgsnd/msgrcv以block方式发送/接收消息时,会因为进程收到了信号而中断。此时msgsnd/msgrcv将返回-1,errno被设置为EINTR。且即使在插入信号时设置了SA_RESTART,也无效。在man msgrcv中就有提到这点:
msgsnd and msgrcv are never automatically restarted after being interrupted by a signal handler, regardless of the setting of the SA_RESTART flag when establishing a signal handler. |
忽略信号
当然最简单的方法是忽略信号,在安装信号时,明确告诉系统不会产生该信号的中断。
1 struct sigaction action; 2 3 action.sa_handler = SIG_IGN; 4 sigemptyset(&action.sa_mask); 5 6 sigaction(SIGALRM, &action, NULL);
另外,在我的 https://github.com/juniperdiego/Unix-network-programming-of-mine/tree/master/tcpserv02 中,
accept是一个慢调用函数
程序在ubuntu 14.04下运行,使用signal(SIGCHLD, sig_chld)情况下,抓不到 EINTR;
使用sigaction(SIGCHLD, &action, NULL);设置了 sa_flag = 0后,才能捕捉到EINTR。
如果设置action.sa_flags |= SA_RESTART;无法抓到EINTR,accept调用会自动重启。