Linux 可执行文件结构与进程结构

Linux可执行文件结构

在 Linux 下，程序是一个普通的可执行文件，以下列出一个二进制可执行文件的基本情况：

可以看出，此可执行文件在存储时（没有调入到内容）分为代码区（text）、数据区（data）和未初始化数据区（bss）3 个部分。各段基本内容说明如下：

代码区：

存放 CPU 执行的机器指令。通常代码区是可共享的（即另外的执行程序可以调用它），使其可共享的目的是对于频繁被执行的程序，只需要在内存中有一份代码即可。代码区通常是只读的，使其只读的原因是防止程序意外地修改了它的指令。另外，代码区还规划了局部变量的相关信息。

代码区的指令包括操作码和操作对象（或对象地址引用）。如果是立即数（即是具体的数值），将直接包含在代码中，如果是局部数据，将在运行时在栈区分配空间，然后再引用该数据的地址，如果是未初始化数据区和数据区，在代码中同样将引用该数据的地址。

全局初始化数据区/静态数据区（数据段）：

该区包含了在程序中明确被初始化的全局变量、已经初始化的静态变量（包括全局静态变量和局部静态变量）和常量数据（如字符串常量）。

例如，一个不在任何函数内声明（全局变量），如下：
int count = 100;
使得变量 count 根据其初始值被存储初始化数据区中。

在任意位置定义静态变量方式如下：
static int num = 200;
这声明了一个静态数据并初始化，如果在任意函数体外声明，则表示其为一个静态全局变量，如果在函数体内（局部），则表示其为一个局部静态变量。另外，如果在一个函数名前加上 static，则表示此函数只能再当前文件中被调用。

未初始化数据区（又叫 BSS 区）：

存入的是全局未初始化变量和未初始化静态变量。未初始化数据区的数据在程序开始执行之前被内核初始化为 0 或者空（NULL）。

例如，一个不在任何函数内声明的未初始化变量。
long sum[1000];
将 sum 存储到未初始化数据区。

Linux进程结构

在 Linux 系统下，如果将某个可执行文件加载到内存运行，则将演变成一个或多个进程（多个进程的原因是进程在运行时可以再创建新的进程，但加载时只有一个进程）。进程是 Linux 事务管理的基本单元，所有的进程均拥有自己独立的处理环境和系统资源。进程的环境由当前系统状态及其父进程信息决定和组成的。

下图为可执行文件存储结构和 Linux 进程基本结构（部分）的对照图。

一个进程是一个运行着的程序段，一个进程主要包括在内存中申请的空间，代码（加载的程序，包括代码段，数据段，BSS），堆，栈，以及内核提供的内核进程信息结构体

task_struct （位置在 /usr/include/linux/sched.h）、打开的文件、上下文（指进程执行活动全过程的静态描述）信息以及挂起的信号等。

（1）代码区（text segment）。加载的是可执行文件代码段，其加载到内存中的位置由加载器完成。

（2）全局初始化数据区/静态数据区（Data Segment）。加载的是可执行文件数据段，存储于数据段（全局初始化，静态初始化数据）的数据的生存周期为整个程序运行过程。

（3）未初始化数据区（BSS）。加载的是可执行文件BSS段，位置可以分开亦可以紧靠数据段，存储于数据段的数据（全局未初始化，静态未初始化数据）的生存周期为整个程序运行过程。

（4）栈区（stack）。由编译器自动分配释放，存放函数的参数值、返回值、局部变量等。在程序运行过程中实时加载和释放，因此，局部变量的生存周期为申请到释放该段栈空间。

（5）堆区（heap）。用于动态内存分配。堆在内存中位于BSS区和栈区之间。一般由程序员分配和释放，若程序员不释放，程序结束时有可能由OS回收。

系统之所以分成这么多个区域，主要基于以下考虑：

代码段和数据段分开，运行时便于分开加载，在哈佛体系结构的处理器将取得更好得流水线效率。
代码时依次执行的，是由处理器 PC 指针依次读入，而且代码可以被多个程序共享，数据在整个运行过程中有可能多次被调用，如果将代码和数据混合在一起将造成空间的浪费。
临时数据以及需要再次使用的代码在运行时放入栈中，生命周期短，便于提高资源利用率。
堆区可以由程序员分配和释放，以便用户自由分配，提高程序的灵活性。

C 各存储类型比较

参考资料：《Linux高级程序设计》

时间： 2024-10-27 08:29:59

Linux 可执行文件结构与进程结构的相关文章

Linux程序存储结构与进程结构堆和栈的差别

摘要:本文主要讲述了Linux系统中.程序存储结构(代码区.数据段和BBS区)与进程的基本结构(代码区.数据段.BBS区.堆和栈).以及堆和栈的差别. Linux程序存储结构与进程结构 1.Linux程序存储结构在Linux系统下,程序是一个普通的可运行文件,图1是一个Linux下ELF格式可运行文件的基本情况. 图1 ELF格式可运行文件的基本信息能够看出,此ELF格式可运行文件在存储时,没有调入到内存,分为代码区(text),数据区(data)和为初始化区(bss)3个部分.各段基本说明

Linux程序存储结构与进程结构堆和栈的区别

摘要:本文主要讲述了Linux系统中,程序存储结构(代码区.数据段和BBS区)与进程的基本结构(代码区.数据段.BBS区.堆和栈),以及堆和栈的区别. Linux程序存储结构与进程结构 1.Linux程序存储结构在Linux系统下,程序是一个普通的可执行文件,图1是一个Linux下ELF格式可执行文件的基本情况. 图1 ELF格式可执行文件的基本信息可以看出,此ELF格式可执行文件在存储时,没有调入到内存,分为代码区(text),数据区(data)和为初始化区(bss)3个部分.各段基本说明

第二十一篇：Linux 操作系统中的进程结构

前言在 Linux 中,一个正在执行的程序往往由各种各样的进程组成,这些进程除了父子关系,还有其他的关系.依赖于这些关系,所有进程构成一个整体,给用户提供完整的服务( 考虑到了终端,即与用户的交互 ). 本文将详细描述 Linux 中的进程结构. 进程结构上图所描述的是为了给用户提供一次完整服务( 需要处理用户IO等 )所涉及到的一个完整的进程结构,几个部分解释如下: 1. 控制进程建立与终端连接的进程称为控制进程( 属于后台进程组之一 ) 2. 前台进程组控制终端( 处理如Ctrl+C

oracle进程结构简介

我们经常说数据库实例,实例其实就是指的是数据库的内存结构和进程结构.我们安装数据库软件大量的是在安装其内存和进程组件结构.上篇节我们介绍了oracle内存结构,这节就介绍下oracle进程结构. 首先看下oracle进程的分类: 1)用户进程是连接到Oracle DB 的应用程序或工具 2)数据库进程服务器进程:连接到Oracle实例,在用户建立会话时启动后台进程:在启动Oracle实例时启动 3) 守护程序/应用程序进程网络监听程序 Gridinfrastructure 守护程序从进

Linux 程序设计学习笔记----进程管理与程序开发（上）

转载请注明出处,http://blog.csdn.net/suool/article/details/38406211,谢谢! Linux进程存储结构和进程结构可执行文件结构如下图: 可以看出,此ELF可执行文件存储时(没有调入内存)分为代码区.数据区和未出花数据区三部分. 代码区:存放cpu的执行的机器指令. 数据区:包含程序中的已经初始化的静态变量,以及已经初始化的全局变量. 未初始化数据区:存入的是未初始化的全局变量和未初始化的静态变量. 现在在上面的程序代码中增加一个int的静态变量

Linux文件系统具有良好的结构，提供了很多文件处理程序，那么常用的文件处理命令有哪些？

本文标签: Linux系统 Linux Linux文件系统 Linux入门 Linux常用命令互联网杂谈 Linux系统信息存放在文件里,文件与普通的公务文件类似.每个文件都有自己的名字.内容.存放地址及其它一些管理信息,如文件的用户.文件的大小等.文件可以是一封信.一个通讯录,或者是程序的源语句.程序的数据,甚至可以包括可执行的程序和其它非正文内容.Linux文件系统具有良好的结构,系统提供了很多文件处理程序.这里主要介绍常用的文件处理命令. file 1.作用 file通过探测文件内

第5章进程环境（1）_进程结构(task_struct)

1. 进程的概念和进程结构 1.1 进程 (1)程序(program):是一些保存在磁盘上有序指令的集合,是存放在磁盘文件中的可执行文件.但没有任何执行的概念,它是静态的. (2)进程(process) ①程序的执行实例被称为进程,是一个动态的概念,它是程序执行的过程,包括创建.调度和消亡. ②进程具有独立的权限与职责,如果系统中某个进程崩溃,它不会影响其余的进程. ③每个进程运行在其各自的虚拟地址空间中,进程之间可以通过由内核控制的机制相互通信. (3)进程ID:每个linux进程都有一个唯一

Linux中表示“时间”的结构体和相关函数

转载于:http://blog.chinaunix.net/uid-25909722-id-2827364.html Linux中表示“时间”的结构体和相关函数 2011-09-13 17:01:13 分类: C/C++ 在Linux系统中,表示“时间”概念的结构体有多个,相关的时间处理函数也有很多,给人以很混乱的感觉.导致了当我们真正要使用这些结构体和函数的时候,却不知道到底该用哪个结构体和哪些函数.有必要加以归纳总结一下.通过查看头文件/usr/include/time.h 和 /usr/i

从ip addr add和ifconfig的区别看linux网卡ip地址的结构

今天一个老外在邮件列表上问了一个问题,就是ip addr add和ifconfig的区别,我给他进行了解答,可能因为英语不好吧,解答的很简单,因此我还是要在这里详细说明一下.其实它们之间没有什么区别,只是表述方式不同罢了.如果你非常理解网络协议的原理以及网络的分层架构那么我想你就不会有这个问题,实际上,每一个网卡设备都有一个mac地址,但是却可以有多个网络层地址,比如IP地址,然而这个事实无法很好地像用户提供操作接口,所以就引出了ip别名(IP aliases)和辅助ip(secondary