这里所说的ARM系统基本文件格式,都是在基于ARM的嵌入式系统开发中常会碰到的文件格式。
ARM系统基本文件格式有三种:
1) BIN,平板式二进制格式,一般用于直接烧写到Flash中,也可以用于加载到monitor程序中。
2) ELF,EXECUTABLE AND LINKABLE FORMAT,一种通用的OBJECT文件格式,一般由GNU COMPILER COLLECTION (GCC)产生。
3) AXF,BIN格式的扩展版,主体部分同BIN,在文件头和尾加入了调试用的信息,用于AXD。
本文主要讨论BIN与ELF。
首先说明,ELF格式是一种OBJECT文件格式。一般OBJECT文件都可以分成三类:可重定位OBJECT文件,可执行OBJECT文件,共享OBJECT文件。ELF格式文件也可以分成这三种。
首
先说说可重定位OBJECT文件。这种OBJECT文件一般由GCC中的ASSEMBLER(as)产生(请不要认为GCC只是编译器),里面除了二进制
的机器代码,还有一些可用于进行重定位的信息。它主要是作为LINKER(ld)的输入,LINKER将跟据这些信息,将需要重定位的符号重定位,进而产
生可执行的OBJECT文件。ELF格式的可重定位OBJECT文件由header与section组成。
Header 包括
ELF header 与 section header. ELF header 位于文件的头部,用于存储目标机器的架构,大小端配
置,ELF header大小,object文件类型,section header 在文件中的偏移,section header 的大
小,section header 中的项目数等信息。Section header 则定义了文件中每个section 的类型,位置,大小等信息。
Linker就是通过查找ELF header,找到section header 的入口,再在section header 中找到相应的
section 入口,进而定位到目标section 的。
Section 包括
.text :经过编译的机器代码。
.rodata :只读的数据,例如printf(“hello!”)中的字符串hello。
.data :已初始化的全局变量,局部变量将在运行时被存放在堆栈中,不会在.data或 .bss段中出现。
.bss :未初始化的全局变量,在这里只是一个占位符,在object文件中并没有实际的存储空间。
.symtab :符号表,用于存放程序中被定义的或被引用到的全局变量和函数的信息。
.rel.text :
一个保存着一系列在.text中的位置的列表。这些位置将在linker把这个文件与其它object文件合并时被修改,一般来说,这些位置都是保存着一
些引用到全局变量或者外部函数的指令。引用局部变量或者本地函数的指令是不需要被修改的,因为局部变量和本地函数的地址一般都是使用PC相对偏移地址的。
需要注意的是,这个section 和下面的.rel.data在运行时并不需要,生成可执行的ELF object文件时会去掉这个section。
.rel.data :保存全局变量的重定位信息。一般来说,如果一个全局变量它的初 始化值是另一个全局变量的地址,或者是外部函数的地址,那么它就需要被重定位。
.debug :保存debug信息。
.strtab : 一
个字符串表,保存着.symtab和.debug ,和各个section的名字。.symtab,.debug 和section table里面,凡
是保存name的域,其实都是保存了一个偏移值,通过这个偏移值在这个字符串表里面可以找到相应得字符串。
下面仔细讨论一下.symtab:
每一个可重定位的object文件,都会有一个.symtab。这个符号表保存了在这个object文件中所有被定义的和被引用的符号。当源程序是C 语言程序时,.symtab 中的符号直接来源于C编译器(cc1)。这里所说的符号主要有三种:
1) 在这个object文件中被定义的可以被其他object文件全局符号。在C语言源程序中,主要就是那些非静态(没有static 修饰的)的全局变量和非静态的函数。在ARM汇编语言中,就是那些 被EXPORT 指令导出的变量。
2) 在这个object文件中引用到,但是在其他文件中定义的全局变量。在ARM汇编语言中就是通过IMPORT命令引入的变量
3) 本
地变量。本地变量只在本object文件内可见。这里的本地变量指的是连接器本地变量,应该和一般的程序本地变量作区别。这里所指的本地变量,包括用
static 修饰的全局变量,object文件中section名称,源代码文件名称。一般意义上的本地变量,是在运行时由系统的运行时环境管理
的,linker并不关心。
每个符合上面条件的符号在.symtab文件中都会有一个数据项。这个数据项的数据结构是:
Typedef struct{
int name;//符号名称,其实就是.strtab的偏移值
int value;//在section中的位置,以相对section地址的偏移表示
int size;//大小
char type;//类型,一般是数据或函数
char binding;//是本地变量还是全局变量
char reserved;//保留的位
char section;//符号所属的section。可选有:.text(用数字1代表),.data(用数
//3代表),ABS(不应被重定位的符号),UND(在本object文件
//中未定义的符号,可能在别的文件中定义),COM(一般的未初//始化的变量符号)。
}ELF_sym
ARM-ELF文件格式与GNU ARM Linker机制,布布扣,bubuko.com