Linux下C程序的链接过程

今天看到一个很有意思的小程序，它让我对Linux下C程序的编译链接有了一个全新的认识！

这个程序的就是写一个简单的输出“hello World!”:

要求：1.不使用C运行库，写一个独立于任何库的程序。（也就是说我们不能#include<stdio>）。

2.不适用main函数为程序的入口（大家都知道一般使用了库的程序都是使用main函数作为程序的入口，在这里我们使用自己写的函数nomain作为程序的入口）。

3.使用连接器ld把程序的所有段合为一个“Tinytext”段。

显然要符合要求我们就只能用汇编去写，源代码如下：

char *str="Hello world!\n";

void print()
{
    asm("movq $13,%%rdx \n\t"
        "movq %0,%%rcx \n\t"
        "movq $0,%%rbx \n\t"
        "movq $4,%%rax \n\t"
        "int $0x80     \n\t"
        ::"r"(str):"edx","ecx","ebx");
}

void exit()
{
   asm("movq $42,%rbx   \n\t"
       "movq $1,%rax    \n\t"
       "int $0x80       \n\t");
}

void nomain()
{
   print();
   exit();
}

我们vi一个TinyHelloWorld.c。里面写上如上代码。

本人的环境是64位的，如果是32为环境的朋友只要把，movq改为movl，rdx改为edx，rax改为eax，rbx改为ebx。

由于操作系统的系统结构发生了变化，在x86-64中，所有通用寄存器（GPRs）都从32位扩充到了64位，名字也发生了变化。8个通用寄存器（eax, ebx, ecx, edx, ebp, esp, esi, edi）在新的结构中被命名为rax, rbx, rcx, rdx, rbp, rsp, rsi, rdi。movl命令也需相应改成movq。

首先程序的入口时nomain函数，它调用print函数打印HelloWorld，然后调用exit函数退出。print函数使用了Linux的WRITE系统调用，exit函数使用了EXIT系统调用。

定义一个字符串，它是放在只读代码段的。

print函数和exit函数中，WRITE系统调用和EXIT系统调用都是通过0x80中断实现的。其中eax为调用号rbx，rcx，rdx是一些寄存器用来传递参数的。比如WRITE系统调用是往一个文件句柄写入数据，如果用C语言来表示WRITE系统调用的话他的函数原型是：

int write(int filedesc,char* buffer,int size)

WRITE的调用号为4，则rax为0。
filedesc表示被写入的句柄文件，我们默认输出为默认终端，他的句柄为0，所以rbx为0。
buffer表示要写入的缓冲区地址使用rcx寄存器传送，我们要输出str字符串，所以rcx=str。
size表示要写入的字节数，这里str的长度为13字节，所以rdx=13。

代码写好以后我们使用普通的命令行来编译链接TinyHelloWorld.c

gcc -c -fno-builtin TinyHelloWorld.c  //生成TinyHelloWorld.o

-c参数是表示编译。
-fno-builtin参数关闭GCC内置函数的功能（GCC中有很多内置的函数，它你会把C库的一些函数替换成内置的函数，以达到优化的功能）
然后链接TinyHelloWorld.o文件生成可执行文件TinyHelloWorld.

ld -static -e nomain -o TinyHelloWorld TinyHelloWorld.o

-static参数指在这里使用静态链接方式。
-e nomai参数表示程序的入口为nomain函数
-o 表示链接

运行可以输出Hello World！

至此，一个HelloWorld程序写好了。

我们使用objdump指令来查看TinyHelloWorld这个文件可以看出来他又4个段：.data .rodata .text .commond 段。这几个段的属性都是只读的，按理来说我们可以把他们合围一个段。这就需要借助ld链接器来实现。

objdump -h TinyHelloWorld

使用-verbose查看默认的链接脚本信息：

ld -verbose TinyHelloWorld

然后编写TinyHelloWorld.lds脚本：

ENTRY(nomain)

SECTIONS
{
  .= 0x08048000 + SIZEOF_HEADERS;
  tinytext : { *(.text) *(.data) *(.rodata)}
  /DISCARD/ :{ *(.comment) }
}

然后使用自己编写的脚本链接目标文件。

gcc -c -fno-builtin TinyHelloWorld.
ld -static -T TinyHelloWorld.lds -o TinyHello TinyHelloWorld.o

-static -T TinyHelloWorld.lds参数是使用静态链接，并且使用自己编写的TinyHelloWorld.lds脚本链接。

它会生成一个588个字节的可执行文件TinyHelloWorld。执行可以打印Hello World！。如果你使用objdump查看TinyHelloWorld的段，你会发现我们达到了将最后一个只有一个段的要求。

时间： 2024-10-12 17:38:04

Linux下C程序的链接过程

Linux下C程序的链接过程的相关文章

linux下c程序的链接、装载和库(1)

linux下c程序的链接、装载和库(3)

linux下c程序的链接、装载和库(2)

Linux下软链接与硬链接的区别

Linux下的程序包管理之源码形式

Linux下动态链接库和静态链接库问题

Linux下c++程序内存泄漏检测代码范例

windows下QT前台和linux下后台程序通过socket通信

linux下java程序与C语言程序通过SOCKET通信的简单例子