周子轩原创作品转载请注明出处 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000
使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用
方法一:使用API在屏幕上显示“hello world”
这个其实也是C语言经典的入门程序,源代码如下
- #include "stdio.h"
- #include "string.h"
- int main()
- {
- char* msg = "Hello World";
- printf("%s", msg);
- return 0;
- }
在实验楼中,打开此次实验链接(http://www.shiyanlou.com/courses/running/731),双击Xfce终端,cd Code目录下,gedit helloworld.c,新建并打开helloworld.c文件,在其中输入上面的代码,保存退出;
然后使用下面的指令编译链接程序:
gcc -o helloworld helloworld.c -m32
接着,运行编译好的程序,
./helloworld
效果如下:
方法二:使用C内嵌汇编代码在屏幕上输出helloworld
Linux中内嵌汇编代码的语法,视频中有详细介绍,这里略去,直接给出代码和注释如下:
- int main()
- {
- char* msg = "Hello World";
- int len = 11;
- int result = 0;
- __asm__ __volatile__("movl %2, %%edx;\n\r" /*传入参数:要显示的字符串长度*/
- "movl %1, %%ecx;\n\r" /*传入参赛:文件描述符(stdout)*/
- "movl $1, %%ebx;\n\r" /*传入参数:要显示的字符串*/
- "movl $4, %%eax;\n\r" /*系统调用号:4 sys_write*/
- "int $0x80" /*触发系统调用中断*/
- :"=m"(result) /*输出部分:本例并未使用*/
- :"m"(msg),"r"(len) /*输入部分:绑定字符串和字符串长度变量*/
- :"%eax");
- return 0;
- }
使用gedit helloworld_asm.c新建文件,并输入上面的代码,使用下面的命令编译
gcc -o helloworld_asm helloworld_asm.c -m32
使用下面的命令运行
./helloworld_asm
运行效果如下
总结
即便是最简单的程序,也难免要用到诸如输入、输出以及退出等操作,而要进行这些操作则需要调用操作系统所提供的服务,也就是系统调用。除非你的程序只完成加减乘除等数学运算,否则将很难避免使用系统调用。在 Linux 平台下有两种方式来使用系统调用:利用封装后的 C 库(libc)或者通过汇编直接调用。
Linux 下的系统调用是通过中断(int 0x80)来实现的。在执行 int 80 指令时,寄存器 eax 中存放的是系统调用的功能号,而传给系统调用的参数则必须按顺序放到寄存器 ebx,ecx,edx,esi,edi 中,当系统调用完成之后,返回值可以在寄存器 eax 中获得。
所有的系统调用功能号都可以在文件 /usr/include/bits/syscall.h 中找到,为了便于使用,它们是用 SYS_<name> 这样的宏来定义的,如 SYS_write、SYS_exit 等。例如,经常用到的 write 函数是如下定义的:
ssize_t write(int fd, const void *buf, size_t count);
该函数的功能最终是通过 SYS_write 这一系统调用来实现的。根据上面的约定,参数 fb、buf 和 count 分别存在寄存器 ebx、ecx 和 edx 中,而系统调用号 SYS_write 则放在寄存器 eax 中,当 int 0x80 指令执行完毕后,返回值可以从寄存器 eax 中获得。
或许你已经发现,在进行系统调用时至多只有 5 个寄存器能够用来保存参数,难道所有系统调用的参数个数都不超过 5 吗?当然不是,例如 mmap 函数就有 6 个参数,这些参数最后都需要传递给系统调用 SYS_mmap:
void * mmap(void *start, size_t length, int prot , int flags, int fd, off_t offset);
当一个系统调用所需的参数个数大于 5 时,执行int 0x80 指令时仍需将系统调用功能号保存在寄存器 eax 中,所不同的只是全部参数应该依次放在一块连续的内存区域里,同时在寄存器 ebx 中保存指向该内存区域的指针。系统调用完成之后,返回值仍将保存在寄存器 eax 中。
由于只是需要一块连续的内存区域来保存系统调用的参数,因此完全可以像普通的函数调用一样使用栈(stack)来传递系统调用所需的参数。但要注意一点,Linux 采用的是 C 语言的调用模式,这就意味着所有参数必须以相反的顺序进栈,即最后一个参数先入栈,而第一个参数则最后入栈。如果采用栈来传递系统调用所需的参数,在执行int 0x80 指令时还应该将栈指针的当前值复制到寄存器 ebx中。