[OS] 可执行文件的装载

http://www.jianshu.com/p/e1300e7a4c48

1. 虚拟内存

在早期的计算机中,程序是直接运行在物理内存上的,程序在运行时访问的地址就是物理地址。可是,当计算机中同时运行多个程序时,就会有很多问题。

假设我们计算有128MB内存,程序A需要10MB,程序B需要100MB,程序C需要20MB。如果我们需要同时运行程序A和B,那么比较直接的做法是将内存的前10MB分配给程序A,10MB~110MB分配给B。
但这样做,地址空间不隔离,内存使用效率低,程序运行的地址不确定。

解决这个问题的办法是增加中间层,使用虚拟地址。通过某些映射的方法,将虚拟地址转换成实际的物理地址。

每个进程都有自己独立的虚拟地址空间,且每个进程只能访问自己的地址空间。

2. 分段

最开始人们使用的一种叫做分段的方法,把一段虚拟空间映射到某个物理地址空间。
比如程序A需要10MB内存,我们首先假设虚拟地址空间为0x00000000~0x00A00000,然后从实际物理内存中分配一个相同大小的物理空间0x00100000~0x00B00000,最后把这两块相同大小的地址空间一一映射。

但是分段的方法换入换出内存的都是整个程序,会造成大量的磁盘操作,严重影响速度。

3. 分页

程序的局部性原理:当一个程序在运行时,在某个时间段内,它只是频繁的用到一小部分数据。

于是人们想到了分页的方法。
基本思想是,把地址空间认为的等分成固定大小的页,由硬件决定支持多种大小的页,操作系统选择一个。
例如,如果虚拟空间有8页,每页大小由1KB,那么虚拟地址空间就是8KB。假设计算机有13条地址线,即拥有2^13的物理寻址能力,那么理论上物理空间可以多达8KB。假设,只配备了6KB的内存。

那么,我们就可以把常用的数据和代码页装载到内存中,把不常用的代码和数据保存在磁盘里,当需要的时候再把它从磁盘中读取到内存中即可。
我们把虚拟空间的页叫做虚拟页(Virtual Page),把物理内存中的页叫做物理页(Physical Page),把磁盘中的页叫做磁盘页(Disk Page)。

如果进程需要的页不在内存中时,就会触发页错误(Page Fault),硬件会捕捉到这个消息,由操作系统接管,把所需要的磁盘页,装入内存中,并建立虚拟内存与物理内存的对应关系。

4. 覆盖装入

程序执行时所需要的指令和数据必须在内存中才能正常运行。最简单的办法就是将程序运行所需要的指令和数据全都装入内存中。但很多情况下,程序所需的内存数量大于物理内存数量,而且相对于磁盘来说,内存是昂贵的,所以人们想尽各种办法,尽可能的有效利用内存。

后来研究发现,程序运行时有局部性原理,于是可以将程序最常用的部分驻留在内存中,而将一些不太常用的数据存放在磁盘里,即动态装入。

覆盖装入(Overlay)和页映射(Paging)是两种很典型的动态装载方法。

覆盖装入在虚拟存储发明之前使用比较广泛,现在几乎已经被淘汰了。覆盖装入的方法把挖掘内存潜力的任务交给了程序员,程序在编写时必须手工分割成若干块,然后编写一个小的辅助代码来管理这些模块何时应该驻留内存,何时应该被替换掉。这个小的辅助代码就是所谓的覆盖管理器(Overlay Manager)。
程序员需要手工将模块按照它们之间的调用依赖关系组织成树状结构。覆盖管理器,保证某个模块被调用时,整个调用路径上的模块都在内存中。

覆盖装入的速度比较慢,是典型的用时间换空间的方法。

5. 页映射

与覆盖装入类似,页映射也不是一下子就把程序的所有数据和指令都装入内存,而是将内存和所有磁盘中的数据和指令按照页(Page)为单位装载和操作。

由于页映射包含操纵系统对页错误的自动处理,可执行文件的装载和执行就简化了,
(1)创建一个具有独立虚拟地址空间的进程
实际上并没有分配空间,而是创建一个页映射函数,将虚拟地址页映射到物理地址页。这些映射关系也可以等到后面程序发生页错误的时候再进行设置。

(2)读取可执行文件头,建立虚拟地址空间与可执行文件的映射关系
这一步所作的是虚拟空间与可执行文件的映射关系。当程序执行发生页错误时,操作系统将从物理内存中分配一个物理页,然后将该“缺页”从磁盘中读取到内存中,再设置缺页的虚拟页和物理页的映射关系,这样程序才得以正常运行。
所以,当操作系统捕获到缺页错误时,它必须知道程序当前所需要的页在可执行文件中的哪一个位置,这就是虚拟空间与可执行文件之间的映射关系。

与可执行文件各个段对应的,Linux中将虚拟空间划分为了相应的段,成为虚拟内存区域(VMA),在Windows中叫做虚拟段(Virtual Section)。
例如:代码VMA,数据VMA,堆VMA,栈VMA

(3)将CPU的指令寄存器设置成可执行文件的入口地址,启动运行
操作系统通过设置CPU的指令寄存器将控制权转交给进程,由此进程开始执行,这个入口地址一般是代码段VMA的起始地址。

注:
当CPU打算执行这个地址的指令的时候,发现此页面是一个空白页,于是它就认为这是一个页错误,CPU将控制权交给操作系统,操作系统有专门的页错误处理例程来处理这种情况,操作系统查找虚拟页与可执行文件页之间的映射关系,计算出相应页面在可执行文件中的偏移,然后在物理内存中分配一个物理页面,将虚拟页与分配的物理页建立映射,再把控制权返还给进程,进程从刚才页错误的位置重新开始执行。

时间: 2024-08-21 18:12:36

[OS] 可执行文件的装载的相关文章

可执行文件的装载

http://blog.csdn.net/sergeycao/article/details/8228613 可执行文件只有被装载进内存以后才能被CPU执行. 接下来我们看一下可执行文件装载的本质到底是什么. 1. 首先来了解一下进程虚拟地址空间. 程序和进程的区别:程序是一个静态的概念,他就是一些预先编译好的指令和数据的集合:而进程则是一个动态的概念,它是程序运行时的一个过程,很多时候吧动态库叫做运行时(Runtime)也是有一定的含义的. 每个程序被运行起来以后它将拥有自己的独立的虚拟地址空

程序员的自我修养-链接、装载与库-6 可执行文件的装载与进程

可执行文件的装载与进程 可执行文件只有装载到内存后才能被CPU执行.基本过程就是把程序从外部存储器中读取到内存中的某个位置. 程序(可执行文件)是一个静态的概念.就是一些预编译好的指令和数据组成的一个文件.进程则是一个动态的概念.很多时候,把动态库叫作运行时. 每个程序在执行时,都拥有自己独立的 虚拟地址空间. 虽然,内存中的虚拟地址空间很大,但是任意一个程序都必须在OS的监督下使用资源,不能任意访问或者占用内存.大多数时候我们在Windows下碰到的"进程因非法操作需要关闭" 和 L

可执行文件的装载于进程

6.1  进程虚拟地址空间 每个程序运行起来以后,它将拥有自己独立的虚拟地址空间,这个虚拟地址空间的大小由计算机的硬件平台决定,具体来说是由CPU的位数决定的 对于windows来说,它的进程虚拟地址空间划分是操作系统占用2GB,那么进程就只剩2GB空间. windows有个启动参数可以将操作系统占用的虚拟地址空间减少到1GB,即跟Linux分布一样.方法如下: 修改windows系统盘根目录下的Boot.ini,加上"/3G"参数 [boot loader] timeout=30 d

程序员的自我修养六可执行文件的装载与进程

可执行文件只有装载到内存以后才能被CPU执行 6.1进程虚拟地址空间 程序和进程的区别: 程序:是一个静态概念,它就是一些预先编译好的指令和数据集合的一个文件. 进程:是一个动态概念,它是程序运行时的一个过程,很多时候把动态库叫做运行时. 程序被运行起来以后,它就拥有了独立的虚拟地址空间.虚拟地址空间大小由CPU的位数决定. 下面使用的CUP都是以32位为主.程序运行的时候,进程只能使用那些操作系统分配给进程的地址. Linux操作系统将进程的虚拟地址做了如下分配: 6.2 装载的方式 程序执行

可执行文件的装载与进程

1.进程虚拟地址空间 每个进程运行起来以后,都将有一个自己的虚拟地址空间,其实这还是计算机制造出来的假象,让进程误以为此时只有它自己在运行,所有内存都只有他自己在使用,一般来说,C语言指针的大小的位数与虚拟空间的位数相同,32位平台下指针为32位,4字节.64位平台下的指针为8字节,但是有些特殊的CPU,并不是这样,暂且不考虑特殊的CPU. 暂时以32位平台为例,这个4G 的虚拟地址空间被分为两个部分,其中1G 为操作系统的空间,也就是之前说的内核代码是共享的,一些常驻在内存中的内核代码,动态库

第七周 linux如何装载和启动一个可执行文件

潘恒 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.实验内容 1.预处理.编译和链接 实践 ELF头部在文件的开始,描述文件的总体格式,保存了路线图,描述该文件的组织情况,即生成该文件系统的字的大小和字节顺序 段头部表用来描述ELF可执行文件与连续的存储段之间的映射关系.节头表包含了描述文件节区的信息,每个节区在表中都有一个项,给出节区的名称.节区大小这类心里.用于链接的目标文件(

装载与动态链接

装载与动态链接 1可执行文件的装载与进程 可执行文件只有装载到内存后才能被CPU执行.早期的程序装载十分简陋,装载的基本过程就是把程序从外部存储器中读取到内存中的某个位置. 历史有过的装载方式包括覆盖装载.页映射. 1.1 进程虚拟地址空间 程序是一个静态的概念,它就是一些预先编译好的指令和数据集合的一个文件:进程则是一个动态的概念,它是程序运行的一个过程. 每个程序被运行起来以后,都有自己的虚拟地址空间,这个虚拟地址空间的大小由计算机的硬件平台决定,具体地说是由CPU的位数决定的. 1.2 装

《Linux内核分析》第七周学习总结 可执行程序的装载

第七周.可执行程序的装载 一.可执行程序是如何产生的? (1).c文件gcc汇编形成.s和.asm汇编代码: (2)汇编代码经过gas变成.o目标文件: (3)目标文件变成可执行文件: (4)可执行文件loader之后存储. 预处理:gcc –E –o hello.cpp hello.c –m32 编译:gcc –x cpp-output –S –o hello.s hello.cpp –m32 //编译为汇编代码 gcc –x assembler –c hello.s –o hello.o –

读《程序员的自我修养 —— 装载与动态链接》乱摘

2016.05.14 – <程序员的自我修养 -- 链接.装载与库>的装载与动态链接部分. - 余甲子 石凡 潘爱民编 个人选读笔记 - 学点表皮. 05.14 PART II 装载与动态链接 1 可执行文件的装载与进程 1.1 进程虚拟地址空间的大小 每个进程拥有自己独立的虚拟地址空间,该虚拟地址空间的大小由计算机的硬件平台决定,具体地说是由CPU的位数决定的(地址线 -- C语言中的指针所占空间).硬件决定了地址空间的最大理论上限,即硬件的寻址空间大小,如32位的硬件平台决定了虚拟地址空间