UNIX环境编程学习笔记(20)——进程管理之exec 函数族

lienhua34
2014-10-07

在文档“进程控制三部曲”中,我们提到 fork 函数创建子进程之后,通常都会调用 exec 函数来执行一个新程序。调用 exec 函数之后,该进程就将执行的程序替换为新的程序,而新的程序则从 main 函数开始执行。

UNIX 提供了 6 种不同的 exec 函数供我们使用。它们的原型如下所示,

#include <unistd.h>
int execl(const char *pathname, const char *arg0, ... /* (char *)0 */);
int execv(const char *pathname, char *const argv[]);
int execle(const char *pathname, const char *arg0, ... /* (char *)0, char *const envp[] */);
int execve(const char *pathname, char *const argv[], char *const envp[]);
int execlp(const char *filename, const char *arg0, ... /* (char *)0 */);
int execvp(cosnt char *filename, char *const argv[]);
6个函数的返回值:若出错则返回-1,若成功则没有返回值

可能很多人会觉得这六个函数太难记了。但是,我们仔细观察会发现,这六个函数的命名是有一些规律的。

• 含有 l 和 v 的 exec 函数的参数表传递方式是不同的。

• 含有 e 结尾的 exec 函数会传递一个环境变量列表。

• 含有 p 结尾的 exec 函数取的是新程序的文件名作为参数,而其他exec 函数取的是新程序的路径。

1 exec 函数的参数表传递方式

exec 函数给新程序传递参数表方式的不同可以通过 exec 函数名称来体现。含有 l(l 表示 list)的 exec 函数(execl、execle 和 execlp)将新程序的参数表以列表的方式传递,要求每个命令行参数作为一个单独的参数,最后空指针结尾。含有 v(v 表示 vector)的 exec 函数(execv、execve 和execvp)将新程序的参数表构造成一个数组进行传递。下面我们来看一个例子,我们有一个程序 echoargs.c,其输出所有的命令行参数。

#include <stdio.h>
#include <stdlib.h>

int
main(int argc, char *argv[])
{
  int i;
  for (i = 1; i < argc; i++) {
    printf("arg%d: %s\n", i, argv[i]);
  }
  exit(0);
}

编译该程序,生成 echoargs 文件,

lienhua34:demo$ gcc -o echoargs echoargs.c

然后在我们的 execdemo.c 中分别以两种不同参数表传递方式来调用execl 和 execv 函数,

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/wait.h>

char echoargsPath[] = "/home/lienhua34/program/c/apue/ch08/demo/echoargs";
char *myargs[] = {"echoargs", "This", "is", "a", "demo" };

int
main(void)
{
  pid_t pid;

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("Transmits arguments by vector\n");
    if (execv(echoargsPath, myargs) < 0) {
      printf("execv error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("Transmits arguments by list\n");
    if (execl(echoargsPath, myargs[0], myargs[1],
              myargs[2], myargs[3], "another", myargs[4], (char *)0) < 0) {
      printf("execv error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  exit(0);
}

编译该程序,生成并执行文件 execdemo,

lienhua34:demo$ gcc -o execdemo execdemo.c
lienhua34:demo$ ./execdemo
Transmits arguments by vector
arg1: This
arg2: is
arg3: a
arg4: demo
Transmits arguments by list
arg1: This
arg2: is
arg3: a
arg4: another
arg5: demo

观察上面的程序 execdemo.c,我们看到传递的参数表中 myargs[0] 等于“echoargs”。这是因为在 C 语言中 main 函数的命令行参数第一个默认都是要该执行程序的文件名。所以,我们这里调用 exec 函数传递参数表是第一个参数也要设置为要执行的新程序文件名。

需要特别说明一点,在调用 execl、execle 和 execlp 函数传递参数表,在最后一个命令行参数之后跟着一个空指针。如果要用常量 0 来表示空指针,则必须要将它转换为一个字符指针,否则它默认会是整型参数。如果一个整型数的长度和 char * 的长度不同,那么 exec 函数在执行时的实际参数将会出错。

2 带有环境变量列表的 exec 函数

带有 e 结尾的 exec 函数(execle 和 execve)可以传递一个指向环境字符串指针数组的指针。其他四个 exec 函数则使用调用进程中的 environ 变量(关于 environ 变量可以参考文档“进程环境变量”)为新进程复制现有的环境。

下面我们来看一个例子。我们有一个 echoenv.c 文件,其输出进程的所有环境变量,其代码如下所示,

#include <stdlib.h>
#include <stdio.h>

int
main(void)
{
  extern char **environ;
  char **ptr;

  for (ptr = environ; *ptr != NULL; ptr++) {
    printf("%s\n", *ptr);
  }
  exit(0);
}

编译该文件,生成并执行 echoenv 文件,

lienhua34:demo$ gcc -o echoenv echoenv.c
lienhua34:demo$ ./echoenv
MANPATH=/usr/local/texlive/2013/texmf-dist/doc/man:
/usr/local/texlive/2013/texmf-dist/doc/man:
SSH_AGENT_PID=1693
...
XAUTHORITY=/home/lienhua34/.Xauthority
_=./echoenv

下面 execedemo.c 文件中,我们分别使用 execv 函数和 execve 函数调用 echoenv 文件,然后查看两者打印的环境变量列表有什么区别。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/wait.h>

char echoenvPath[] = "/home/lienhua34/program/c/apue/ch08/demo/echoenv";
char *myEnvs[] = { "env1=foo", "env2=bar" };

int
main(void)
{
  pid_t pid;

  if (putenv("newenv=add in parent process") < 0) {
    printf("putenv error: %s\n", strerror(errno));
    exit(-1);
  }

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("Call echoenv by execv\n");
    if (execv(echoenvPath, NULL) < 0) {
      printf("execv error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    printf("\nCall echoenv by execve\n");
    if (execve(echoenvPath, NULL, myEnvs) < 0) {
      printf("execve error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  exit(0);
}

execedemo.c

编译该程序,生成并执行文件 execedemo,

lienhua34:demo$ gcc -o execedemo execedemo.c
lienhua34:demo$ ./execedemo
Call echoenv by execv
MANPATH=/usr/local/texlive/2013/texmf-dist/doc/man:
/usr/local/texlive/2013/texmf-dist/doc/man:
SSH_AGENT_PID=1693
...
XAUTHORITY=/home/lienhua34/.Xauthority
_=./execedemo
newenv=add in parent process
Call echoenv by execve
env1=foo
env2=bar

从上面的运行结果,我们看到调用 execv 函数时父进程会将其设置的环境变量(newenv=add in parent process)也传递给了子进程。而调用execve 函数时,子进程的环境变量列表只有 execve 函数传递的 myEnvs 列表。

3 取文件名作为参数的 exec 函数

含有 p 作为结尾的两个 exec 函数(execlp 和 execvp)传递的是新程序的文件名,而其它四个传递的是路径名。这两个 exec 函数传递的 filename参数按照 PATH 环境变量,在指定的各个目录中寻找可执行文件。

PATH 环境变量包含一张目录表(称为路径前缀),目录之间用冒号(:)分割。例如,
    PATH=/bin:/usr/bin:/usr/local/bin:.
指定了四个目录项,最后一个路径前缀是当前目录。(零长前缀也表示当前目录,在 value 的开始处可用: 表示,在行中间则要用:: 表示,在行尾则以:表示。)

我们来看一个例子。我们有一个 execvpdemo.c 文件,在该文件的目录下有一个 echoargs 可执行文件,该执行文件输出命令行参数。

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <errno.h>
#include <string.h>
#include <sys/wait.h>
char *myargs[] = {"echoargs", "hello" };
int
main(void)
{
  pid_t pid;
  char *pathEnvVal;

  if ((pathEnvVal = getenv("PATH")) == NULL) {
    printf("putenv error: %s\n", strerror(errno));
    exit(-1);
  }
  printf("PATH=%s\n", pathEnvVal);

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    if (execvp("echoargs", myargs) < 0) {
      printf("execve error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  if (setenv("PATH", "/usr/bin:.", 1) < 0) {
    printf("setenv error: %s\n", strerror(errno));
    exit(-1);
  }
  printf("PATH=/usr/bin:.\n");

  if ((pid = fork()) < 0) {
    printf("fork error: %s\n", strerror(errno));
    exit(-1);
  } else if (pid == 0) {
    if (execvp("echoargs", myargs) < 0) {
      printf("execve error: %s\n", strerror(errno));
      exit(-1);
    }
  }
  wait(NULL);

  exit(0);
}

execvpdemo.c

编译该程序,生成并执行文件 execvpdemo,

lienhua34:demo$ gcc -o execvpdemo execvpdemo.c
lienhua34:demo$ ./execvpdemo
PATH=/usr/local/texlive/2013/bin/i386-linux:/usr/local/texlive/2013/bin/i386-linux:/usr/lib/lightdm/lightdm:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games
execve error: No such file or directory
PATH=/usr/bin:.
arg1: hello

从上面的运行结果,我们看到在原始的 PATH 环境变量中没有包含当前目录,于是调用 execvp 函数失败,提示找不到 echoargs 文件。而当将PATH 环境变量设置为“/usr/bin:.”之后,调用 execvp 函数能够正常执行echoargs 文件。

4 exec 函数的其他性质

在调用 exec 函数新程序之后,新进程会保留 exec 之前进程的大多数特征。但是,有几个需要特殊说明一下:有效用户 ID、有效组 ID 和文件描述符。

在执行 exec 前后进程的实际用户 ID 和实际组 ID 保持不变,而有效用户 ID 和有效组 ID 是否改变跟要执行的程序文件的设置用户 ID 和设置组 ID 位有关。如果要执行的程序文件的设置用户 ID 位没有设置,则有效用户 ID 不变;否则,执行 exec 之后,进程的有效用户 ID 将被设置为要执行的程序文件的所有者。(对于有效组 ID 的情况类似。)

在文档“fcntl 函数访问已打开文件的性质”中,我们提到打开的文件描述符都有一个执行时关闭标志(close-on-exec),该标志跟调用 exec 时是否要关闭该文件描述符有关。若某个打开的文件描述符设置了执行时关闭标志,则在执行 exec 函数时会将该描述符关闭,否则该描述符保持不变。文件描述符的执行时关闭标志默认是不设置的。

POSIX.1 明确要求在执行 exec 时关闭打开的目录流。这通常是由opendir 函数实现的,它调用 fcntl 函数为对应打开目录流的文件描述符设置执行时关闭标志。

(done)

时间: 2024-10-06 01:04:07

UNIX环境编程学习笔记(20)——进程管理之exec 函数族的相关文章

UNIX环境编程学习笔记(19)——进程管理之fork 函数的深入学习

lienhua342014-10-07 在“进程控制三部曲”中,我们学习到了 fork 是三部曲的第一部,用于创建一个新进程.但是关于 fork 的更深入的一些的东西我们还没有涉及到,例如,fork 创建的新进程与调用进程之间的关系.父子进程的数据共享问题等.fork 是否可以无限制的调用?如果不行的话,最大限制是多少?另外,我们还将学习一个 fork 的变体 vfork. 1 fork 创建的新进程与调用进程之间的关系 UNIX 操作系统中的所有进程之间的关系呈现一个树形结构.除了进程 ID

UNIX环境编程学习笔记(21)——进程管理之获取进程终止状态的 wait 和 waitpid 函数

lienhua342014-10-12 当一个进程正常或者异常终止时,内核就向其父进程发送 SIGCHLD信号.父进程可以选择忽略该信号,或者提供一个该信号发生时即被调用的函数(信号处理程序).对于这种信号的系统默认动作是忽略它. 在文档“进程控制三部曲”中,我们讲的第三部曲是使用 wait 函数来获取终止子进程的终止状态.那么,有几个问题我们这里需要详细的学习一下. 1. 父进程一定能够获取到子进程的终止状态吗?如果子进程在父进程调用 wait 函数前就终止了,怎么办? 2. 如果父进程没有获

UNIX环境编程学习笔记(18)——进程管理之进程控制三部曲

lienhua342014-10-05 1 进程控制三部曲概述 UNIX 系统提供了 fork.exec.exit 和 wait 等基本的进程控制原语.通过这些进程控制原语,我们即可完成对进程创建.执行和终止等基本操作.进程的控制可以划分为三部曲, • 第一部:fork 创建新进程. • 第二部:exec 执行新程序. • 第三部:exit 和 wait 处理终止和等待终止. 2 第一部:fork 创建新进程 在一个现有的进程中,我们可以通过调用 fork 函数来创建一个新进程, #includ

UNIX环境编程学习笔记(17)——进程管理之进程的几个基本概念

lienhua342014-10-05 1 main 函数是如何被调用的? 在编译 C 程序时,C 编译器调用链接器在生成的目标可执行程序文件中,设置一个特殊的启动例程为程序的起始地址.当内核执行 C 程序时,在调用 main 前先调用这个特殊的启动例程,该启动例程从内核取得命令行参数和环境变量值. 2 共享库 共享库使得可执行文件中不再需要包含共用的库例程,而只需在所有进程都可引用的存储区中维护这种库例程的一个副本.程序第一次执行或者第一次调用某个库函数时,用动态链接方法将程序与共享库函数相链

UNIX环境编程学习笔记(22)——进程管理之system 函数执行命令行字符串

lienhua342014-10-15 ISO C 定义了 system 函数,用于在程序中执行一个命令字符串.其声明如下, #include <stdlib.h> int system(const char *cmdstring); system 函数在其实现中调用了 fork.exec 和 waitpid 函数.system 函数调用 fork 函数创建子进程,然后由子进程调用’/bin/sh -c cmdstring’ 来执行命令行参数 cmdstring,此命令执行完后便返回调用的进程

UNIX环境编程学习笔记(16)——进程管理之进程环境变量

lienhua342014-10-03 1 环境表和环境指针 在每个进程启动时,都会接到一张环境表.环境表是一个字符指针数组,其中每个指针包含一个以 null 结束的 C 字符串的地址.全局变量environ 则包含了该指针数组的地址, extern char **environ; 例如,图 1 显示了包含有 5 个环境字符串的环境表, 图 1: 含有 5 个环境字符串的环境表 2 环境变量 环境字符串的形式通常为,name=value. ISO C 定义了一个函数 getenv,用于获取环境变

UNIX环境编程学习笔记(15)——进程管理之进程终止

lienhua342014-10-02 1 进程的终止方式 进程的终止方式有 8 种,其中 5 种为正常终止,它们是 1. 从 main 返回. 2. 调用 exit. 3. 调用_exit 或_Exit. 4. 最后一个线程从其启动例程返回. 5. 最后一个线程调用pthread_exit. 另外三种为异常终止方式,它们是 1. 调用 abort. 2. 接到一个信号并终止. 3. 最后一个线程对取消请求做出响应. 2 exit 函数 有三个函数用于正常终止一个程序:_exit 和_Exit

UNIX环境编程学习笔记(7)——文件I/O之文件访问权限与进程访问控制

lienhua342014-09-02 1 文件的设置用户 ID位 和设置组 ID位 与进程相关联的 ID 如下表所示, 表 1: 与进程相关联的用户 ID 和组 ID 实际用户 ID 我们实际上是谁 实际组 ID 有效用户 ID 用于文件访问权限检查 有效组 ID 附加组 ID 保存的设置用户 ID 由 exec 函数保存 保存的设置组 ID 保存的设置用户 ID 和保存的设置组 ID 在执行一个程序时包含了有效用户 ID 和有效组 ID 的副本,这个后面我们学习到进程时在详细学习. 此处,我

UNIX环境编程学习笔记(24)——信号处理进阶学习之信号集和进程信号屏蔽字

lienhua342014-11-03 1 信号传递过程 信号源为目标进程产生了一个信号,然后由内核来决定是否要将该信号传递给目标进程.从信号产生到传递给目标进程的流程图如图 1 所示, 图 1: 信号产生.传递到处理的流程图 进程可以阻塞信号的传递.当信号源为目标进程产生了一个信号之后,内核会执行依次执行下面操作, 1. 如果目标进程设置了忽略该信号,则内核直接将该信号丢弃. 2. 如果目标进程没有阻塞该信号,则内核将该信号传递给目标进程,由目标进程执行相对应操作. 3. 如果目标进程设置阻塞