第九章 虚拟存储器
虚拟存储器是计算机系统最重要的概念之一,它是对主存的一个抽象
物理和虚拟寻址
计算机系统的主存被组织成一个由M个连续的字节大小的单元组成的数组,每字节都有一个唯一的物理地址PA。
根据物理地址寻址的是物理寻址。
虚拟存储器被组织为一个由存放在磁盘上的N个连续的字节大小的单元组成的数组。
使用虚拟寻址时,CPU通过生成一个虚拟地址VA来访问主存,这个虚拟地址在被送到存储器之前先转换成适当的物理地址(这个过程叫做地址翻译,相关硬件为存储器管理单元MMU)
虚拟存储器作为缓存的工具
虚拟存储器——虚拟页VP,每个虚拟页大小为P=2^平字节
物理存储器——物理页PP,也叫页帧,大小也为P字节。
虚拟存储器中的局部性
局部性原则保证了在任意时刻,程序将往往在一个较小的活动页面集合上工作,这个集合叫做工作集/常驻集
所以只要程序有良好的时间局部性,虚拟存储器系统就能工作的相当好。
虚拟存储器作为存储器管理的工具
操作系统为每个进程提供了一个独立的页表,也就是一个独立的虚拟地址空间。
抖个虚拟页面可以映射到同一个共享物理页面上。
存储器映射:将一组连续的虚拟页映射到任意一个文件中的任意位置的表示法。
VM简化了链接和加载、代码和数据共享,以及应用程序的存储器分配。
这里需要知道PTE的三个许可位:
SUP:表示进程是否必须运行在内核模式下才能访问该页
READ:读权限
WRITE:写权限。
当页面命中时,CPU动作:
处理器生成虚拟地址,传给MMU
MMU生成PTE地址,并从高速缓存/主存请求得到他
高速缓存/主存向MMU返回PTE
MMU构造物理地址,并把它传给高速缓存/主存高速缓存/主存返回所请求的数据给处理器。
处理缺页时:
处理器生成虚拟地址,传给MMU
MMU生成PTE地址,并从高速缓存/主存请求得到他
高速缓存/主存向MMU返回PTE
PTE中有效位为0,触发缺页异常
确定牺牲页
调入新页面,更新PTE
返回原来的进程,再次执行导致缺页的指令,会命中
第七节 案例研究
一、Core i7地址翻
在这里,PTE有三个权限位:
- R/W位:确定内容是读写还是只读
- U/S位:确定是否能在用户模式访问该页
- XD位:禁止执行位,64位系统中引入,可以用来禁止从某些存储器页取指令
还有连个缺页处理程序涉及到的位:
- A位,引用位,实现页替换算法
- D位,脏位,告诉是否必须写回牺牲页
二、Linux虚拟存储器系统
内核虚拟存储器包括:内核中的代码和数据结构。
一部分区域映射到所有进程共享的物理页面
另一部分包含每个进程都不相同的数据。
一、Linux虚拟存储器区域
区域:就是已分配的虚拟存储器的连续片。
区域的例子:
- 代码段
- 数据段
- 堆
- 共享库段
- 用户栈
- ……
每个存在的虚拟页面都保存在某个区域中。内核为系统中的每个进程维护一个单独的任务结构task_struct:
- 私有对象运用的技术:写时拷贝
- 在物理存储器中只保存有私有对象的一份拷贝
fork函数就是应用了写时拷贝技术,至于execve函数:
使用mmap函数的用户级存储器映射
void *mmap(void *start, size_t length, int prot, int flags, int fd, off_t offset); 成功返回指向映射区域的指针,若出错则为-1
参数含义:
- start:这个区域从start开始
- fd:文件描述符
- length:连续的对象片大小
- offset:距文件开始处的偏移量
- prot:访问权限位,具体如下:
PROT_EXEC:由可以被CPU执行的指令组成 PROT_READ:可读 PROT_WRITE:可写 PROT_NONE:不能被访问
- flag:由描述被映射对象类型的位组成,具体如下:
MAP_ANON:匿名对象,虚拟页面是二进制0 MAP_PRIVATE:私有的、写时拷贝的对象 MAP_SHARED:共享对象
int munmap(void *start, size_t length); 成功返回0,失败返回-1
从start开始删除,由接下来length字节组成的区域。
动态存储器分配
1.堆:
是一个请求二进制0的区域,紧接在未初始化的bss区域后开始,并向上(更高的地址)生长。有一个变量brk指向堆的顶部
2.分配器的两种基本风格:
a.显示分配器-malloc和free
b.隐式分配器/垃圾收集器
malloc和free函数:
系统调用malloc函数,从堆中分配块:
#include <stdlib.h>
void *malloc(size_t size);
成功返回指针,指向大小至少为size字节的存储器块,失败返回NULL
系统调用free函数来释放已分配的堆块:
#include <stdlib.h>
void free(void *ptr);
无返回值
ptr参数必须指向一个从malloc、calloc或者reallov获得的已分配块的起始位置。
碎片
虽然有未使用的存储器,但是不能用来满足分配请求时,发生这种现象。
1.内部碎片
发生在一个已分配块比有效载荷大的时候
易于量化。
2.外部碎片
发生在当空闲存储器合计起来足够满足一个分配请求,但是没有一个单独的空间块足以处理这个请求时发生
难以量化,不可预测。
隐式空闲链表
堆块的格式:
由一个字的头部,有效荷载,和可能的额外填充组成。
空闲块通过头部中的大小字段隐含地连接着,分配器可以通过遍历堆中所有的块,从而间接地遍历整个空闲块的集合。
需要:特殊标记的结束块。
系统对齐要求和分配器对块格式的选择会对分配器上的最小块大小有强制的要求。
放置已分配的块——放置策略
1.首次适配
从头开始搜索空闲链表,选择第一个合适的空闲块
2.下一次适配
从上一次搜索的结束位置开始搜索
3.最佳适配
检索每个空闲块,选择适合所需请求大小的最小空闲块
申请额外的堆存储器
用到sbrk函数:
#include <unistd.h>
vid *sbrk(intptr_t incr);
成功则返回旧的brk指针,出错为-1
通过将内核的brk指针增加incr来扩展和收缩堆。
总结:
本章的知识点比较多,也比较零碎,组织起来有一定的困难,对计算机的存储系统还是有一点认识不足,
但通过本章的学习,还是能很好地提高我们对计算机的理解,也在一定程度上帮助我们实现计算机安全打下基础
参考资料:
课本
闫佳歆