gcc/g++等编译器 编译原理: 预处理,编译,汇编,链接各步骤详解

摘自http://blog.csdn.net/elfprincexu/article/details/45043971

gcc/g++等编译器 编译原理: 预处理,编译,汇编,链接各步骤详解

C和C++编译器是集成的,编译一般分为四个步骤:

  1. 预处理(preprocessing)  ----------------- cpp/ gcc -E 
  2. 编译(compilation) ------------------ cc1 / gcc -S
  3. 汇编(assembly)  -------------------- as
  4. 连接(linking) --------------------- ld 

 

 


gcc

  认为预处理的文件是(.i)是C文件,并且设定C形式的连接;

g++

  认为预处理的文件是(.i)是C++文件,并且设定C++形式的连接;

源文件后缀名的一些含义和后续的操作:

  • .c       C源程序        预处理,编译,汇编
  • .C      C++源程序        预处理,编译,汇编
  • .cc       C++源程序  
  • .cxx       C++源程序        预处理,编译,汇编
  • .m       Objective-C源程序   预处理,编译,汇编
  • .i       预处理后的C文件     编译,汇编
  • .ii      预处理后的C++文件   编译,汇编
  • .s      汇编语言源程序     汇编
  • .S      汇编语言源程序     预处理,汇编
  • .h      预处理器文件      通常不出现在命令行上  

其他后缀名的文件被传递给连接器(linker).通常包括:

  .o 目标文件(Object file)

  .a 归档库文件(Archive file)

转载请注明出处: http://blog.csdn.net/elfprincexu

二、具体介绍一下GCC编译步骤

首先,有以下hello.c源代码

[cpp] view plain copy

print?

  1. #include<stdio.h>
  2. int main()
  3. {
  4. printf("Hello! This is our embedded world!\n");
  5. return 0;
  6. }

(1)预处理阶段

在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用Gcc的选项”-E”进行查看,该选项的作用是让Gcc在预处理结束后停止编译过程。预处理阶段主要处理#include和#define,它把#include包含进来的.h 文件插入到#include所在的位置,把源程序中使用到的用#define定义的宏用实际的字符串代替,我们可以用-E选项要求gcc只进行预处理而不进行后面的三个阶段,

 注意 : Gcc指令的一般格式为:Gcc [选项] 要编译的文件 [选项] [目标文件]

其中,目标文件可缺省,Gcc默认生成可执行的文件,命为:编译文件.out

[[email protected] Gcc]# Gcc –E hello.c –o hello.i

在此处,选项"-o"是指目标文件,".i"文件为已经过预处理的C原始程序。以下列出了hello.i文件的部分内容:

[cpp] view plain copy

print?

  1. typedef int (*__gconv_trans_fct) (struct __gconv_step *,
  2. struct __gconv_step_data *, void *,
  3. __const unsigned char *,
  4. __const unsigned char **,
  5. __const unsigned char *, unsigned char **,
  6. size_t *);
  7. # 2 "hello.c" 2
  8. int main()
  9. {
  10. printf("Hello! This is our embedded world!\n");
  11. return 0;
  12. }

由此可见,Gcc确实进行了预处理,它把”stdio.h”的内容插入到hello.i文件中。

(2)编译阶段

接下来进行的是编译阶段,在这个阶段中,Gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,Gcc把代码翻译成汇编语言。用户可以使用”-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。

编译阶段是最重要的阶段,在这个阶段GCC首先检查语法然后把由上步生成的*.i编译成*.s文件。我们可以用如下命令告诉gcc进行这一步处理,gcc -S hello.i -o hello.s,-S选项告诉gcc把hello.i编译成.s文件;

上面这两步的输出文件都是文本文件,我们可以用诸如cat的文本处理等命令阅读这些输出文件。

这个阶段可以接收.c和.i类型的文件

[[email protected] Gcc]# Gcc –S hello.i –o hello.s

以下列出了hello.s的内容,可见Gcc已经将其转化为汇编了,感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。

[cpp] view plain copy

print?

  1. .file   "hello.c"
  2. .section    .rodata
  3. .align 4
  4. .LC0:
  5. .string     "Hello! This is our embedded world!"
  6. .text
  7. .globl main
  8. .type main, @function
  9. main:
  10. pushl %ebp
  11. movl %esp, %ebp
  12. subl $8, %esp
  13. andl $-16, %esp
  14. movl $0, %eax
  15. addl $15, %eax
  16. addl $15, %eax
  17. shrl $4, %eax
  18. sall $4, %eax
  19. subl %eax, %esp
  20. subl $12, %esp
  21. pushl $.LC0
  22. call puts
  23. addl $16, %esp
  24. movl $0, %eax
  25. leave
  26. ret
  27. .size   main, .-main
  28. .ident  "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"
  29. .section    .note.GNU-stack,"",@progbits

(3)汇编阶段

汇编阶段把*.s文件翻译成二进制机器指令文件*.o,如命令gcc -c hello.s -o hello.o,其中-c告诉gcc进行汇编处理。这步生成的文件是二进制文件,直接用文本工具打开看到的将是乱码,我们需要反汇编工具如GDB的帮助才能读懂它;

这个阶段接收.c, .i, .s的文件都没有问题。比如gcc -c hello.i -o hello.o等

汇编阶段是把编译阶段生成的”.s”文件转成目标文件,读者在此可使用选项”-c”就可看到汇编代码已转化为”.o”的二进制目标代码了。如下所示:

[[email protected] Gcc]# Gcc –c hello.s –o hello.o

(4)链接阶段

在成功编译之后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。

读者可以重新查看这个小程序,在这个程序中并没有定义”printf”的函数实现,且在预编译中包含进的”stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实现”printf”函数的呢?最后的答案是:系统把这些函数实现都被做到名为libc.so.6的库文件中去了,在没有特别指定时,Gcc会到系统默认的搜索路径”/usr/lib”下进行查找,也就是链接到libc.so.6库函数中去,这样就能实现函数”printf”了,而这也就是链接的作用。

函数库一般分为静态库和动态库两种。

  • 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a”。
  • 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。Gcc在编译时默认使用动态库。

[cpp] view plain copy

print?

  1. 说下生成静态库的方法:
  2. ar cr libxxx.a file1.o file2.o
  3. 就是把file1.o和file2.o打包生成libxxx.a静态库
  4. 使用的时候
  5. gcc test.c -L/path -lxxx -o test
  6. 动态库的话:
  7. gcc -fPIC -shared file1.c -o libxxx.so
  8. 也可以分成两部来写:
  9. gcc -fPIC file1.c -c //这一步生成file1.o
  10. gcc -shared file1.o -o libtest.so

效果是一样的。

用的时候和上面的静态库的用法一样

但是到了运行程序的时候,需要指定动态库的位置,可以环境变量来指定

export LD_LIBRARY_PATH=path,否则会提示找不到动态库的位置

由于链接动态库和静态库的时候使用的方法是一样的,所以如果在库中有同名的静态库文件和动态库文件,比如libtest.a和libtest.so,根据gcc链接时默认优先选择动态库,会链接libtest.so,如果想要让gcc选择链接libtest.a那么需要指定一个选项,就是-static,这样就会强制gcc找静态库文件了。

静态库链接时搜索路径顺序:

  • 1. ld会去找GCC命令中的参数-L
  • 2. 再找gcc的环境变量LIBRARY_PATH
  • 3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初compile gcc时写在程序内的

动态链接时、执行时搜索路径顺序:

  • 1. 编译目标代码时指定的动态库搜索路径
  • 2. 环境变量LD_LIBRARY_PATH指定的动态库搜索路径
  • 3. 配置文件/etc/ld.so.conf中指定的动态库搜索路径
  • 4. 默认的动态库搜索路径/lib
  • 5. 默认的动态库搜索路径/usr/lib

有关环境变量:

  • LIBRARY_PATH环境变量:指定程序静态链接库文件搜索路径
  • LD_LIBRARY_PATH环境变量:指定程序动态链接库文件搜索路径

完成了链接之后,Gcc就可以生成可执行文件,如下所示。

[[email protected] Gcc]# Gcc hello.o –o hello

运行该可执行文件,出现正确的结果如下。

[[email protected] Gcc]# ./hello

Hello! This is our embedded world!

时间: 2024-08-02 02:46:28

gcc/g++等编译器 编译原理: 预处理,编译,汇编,链接各步骤详解的相关文章

编译原理 (预处理&gt;编译&gt;汇编&gt;链接)(转)

一般高级语言程序编译的过程:预处理.编译.汇编.链接.gcc在后台实际上也经历了这几个过程,我们可以通过-v参数查看它的编译细节,如果想看某个具体的编译过程,则可以分别使用-E,-S,-c和 -O,对应的后台工具则分别为cpp,cc1,as,ld.下面我们将逐步分析这几个过程以及相关的内容,诸如语法检查.代码调试.汇编语言等. 1.预处理 预处理是C语言程序从源代码变成可执行程序的第一步,主要是C语言编译器对各种预处理命令进行处理,包括头文件的包含.宏定义的扩展.条件编译的选择等.打印出预处理之

linux Mysql 主从复制 原理介绍和步骤详解

大家好,我是霸王卸甲,今天我给大家带来的是linux数据库中的主从复制的简单介绍和步骤详解. 主从复制 mysql主从复制 灵活 一主一从 主主复制 一主多从---扩展系统读取的性能,因为读是在从库读取的: 多主一从---5.7开始支持 联级复制--- 用途及条件 mysql主从复制用途 实时灾备,用于故障切换 读写分离,提供查询服务 备份,避免影响业务 主从部署必要条件: 主库开启binlog日志(设置log-bin参数) 主从server-id不同 从库服务器能连通主库 主从原理mysql主

编译安装httpd-2.4.9及新特性详解

前言 前面我们讲解了httpd在CentOS6上(httpd-2.2)的相关功能配置,而CentOS7上采用了httpd-2.4的版本,那么httpd-2.4增加了哪些特性呢?接下来让我们在CentOS6.6上手动编译安装一下httpd-2.4.9,看一下和httpd-2.2有什么不同,顺便补充说一下httpd的其它功能. 环境及新特性介绍 环境介绍 系统环境:CentOS6.6 所需软件包:apr-1.5.0.tar.bz2.apr-util-1.5.3.tar.bz2.httpd-2.4.9

图像小波变换原理_图像小波变换的matlab实现详解

小波变换的原理 所谓的小波的小是针对傅里叶波而言,傅里叶波指的是在时域空间无穷震荡的正弦(或余弦波). 相对而言,小波指的是一种能量在时域非常集中的波,它的能量有限,都集中在某一点附近,而且积分的值为零,这说明它与傅里叶波一样是正交波. 举一些小波的例子: 可以看到,能量集中在x轴0值附近,以y轴的0值为基线,上下两个区域的波形面积相等. 众所周知,图像的傅里叶变换是将图像信号分解为各种不同频率的正弦波.同样,小波变换是将图像信号分解为由原始小波位移和缩放之后的一组小波. 小波在图像处理里被称为

Java虚拟机原理图解 2.3、常量池详解(下)

[java] view plaincopyprint? package com.louis.jvm; public class Person { private String name; private int age; public String getName() { return name; } public void setName(String name) { this.name = name; } public int getAge() { return age; } public 

平衡二叉搜索树(AVL树)的原理及实现源代码(有图文详解和C++、Java实现代码)

一.AVL树(平衡二叉搜索树)是什么? AVL树是根据它的发明者G.M. Adelson-Velsky和E.M. Landis命名的.AVL树本质上还是一棵二叉搜索树,它的特点是: 1.本身首先是一棵二叉搜索树. 2.带有平衡条件:每个非叶子结点的左右子树的高度之差的绝对值(平衡因子)最多为1. 例如: 5             5 / \            /  \ 2   6         2   6 / \    \         / \ 1  4   7       1  4

常见RAID级别原理, Linux中软RAID实现方式详解

前言:本文章耗费作者大量时间,转载声明转自anyisalin.blog.51cto.com RAID简介 RAID(Redundant Arry of Independent Disks)独立冗余阵列,旧称(Redundant Arry of Inexpensive Disks)廉价冗余阵列,其主要目的是将多个硬盘组成在一起来达到提高I/O.读写.冗余性. RAID分为硬件RAID和软件RAID 硬件RAID通过RAID卡连接多个硬盘.或者主板中集成了RAID控制器来实现RAID的相关功能. 软

13.zookeeper原理解析-服务器端处理流程之处理器详解

===================斩秋|http://blog.csdn.net/quhongwei_zhanqiu=============== 各个processor的主要功能 1) PrepRequestProcessor 如名字这个处理器主要功能是对请求进行预处理, 将client向server请求二进制数据反序列化成sever中请求操作. PrepRequestProcessor做为leader的第一个处理器,它的请求数据来源主要来自: (1)    Leader做一个zk服务接收

《深入理解mybatis原理》 MyBatis的一级缓存实现详解 及使用注意事项

0.写在前面 MyBatis是一个简单,小巧但功能非常强大的ORM开源框架,它的功能强大也体现在它的缓存机制上.MyBatis提供了一级缓存.二级缓存 这两个缓存机制,能够很好地处理和维护缓存,以提高系统的性能.本文的目的则是向读者详细介绍MyBatis的一级缓存,深入源码,解析MyBatis一级缓存的实现原理,并且针对一级缓存的特点提出了在实际使用过程中应该注意的事项. 读完本文,你将会学到: 1.什么是一级缓存?为什么使用一级缓存? 2.MyBatis的一级缓存是怎样组织的?(即SqlSes