深入理解计算机操作系统(笔记)

1.实时系统概念

2.编译连接

3.AT&T汇编指令学习(GCC)

4.内存对齐

5.Big-Endian大端模式和Little-Endian小端模式

6.过程调用

1.实时系统概念

前后台系统

后台是各种面向硬件的程序，如中断，定时器，gpio等。

前台是：

main()
{

    while(1)
    {
        ;
    }
}

循环中不断调用各种函数实现功能。

代码临界段

指处理时不可分割的代码，一旦这部分代码运行就不可以打断、

为了确保代码能正常运行，进入临界段代码钱需要关中断，执行完后再开中断。

任务

一个任务也就是一个线程，是一个简单的程序。

任务间通信最简单的办法是使用数据共享结构。

任务间通信途径：1）全局变量；2）发消息给另一个任务。

任务切换（context switch）

基于优先级的内核

不可剥夺型内核，允许使用不可重入函数。

可剥夺型内核，，最高优先级的任务一就绪，总能得到CPU的使用权。，不能直接使用不可重入函数。

互斥条件

处理共享数据时保证互斥，最简单的办法是关中断和开中断。

信号量

一种约定机制。

就好像一把钥匙。任务要运行下去需要获得信号量，且信号量没有被占用。

死锁

两个任务相互等待对方释放资源。

同步

一个中断或者任务触发另一个任务。

邮箱

一种内存共享方式。

时钟节拍

特定的周期性中断，如同系统的心脏。

2.编译连接

目标文件的格式

可重定位文件：

包含代码和数据
可被用来链接成执行文件或者共享目标文件
linux（.o） windows（.obj）

可执行文件：

包含可以执行的程序
系统可以直接执行的文件
linux (ELF文件,无后缀) windows (.exe)

共享目标文件：

包含代码和数据
跟可重定位文件和共享目标文件链接，产生新的目标文件
动态连接器将共享目标文件与可执行文件结合，作为进程映像的一部分来运行
linux（.so） windows (.DLL)

核心转储文件

Linux（core dump）

目标文件的具体内容

file header

目标文件头

code section

程序指令(.code /.text)
存放程序代码程序

data section

程序数据(.data /.bss)
.data段 初始化的全局和局部静态变量
.bss段  未初始化的全局和局部静态变量
.bss（block started by symbol）符号预留块,没有内容不占据空间

othe section

还有可能包含的其他段，例 bank data .ect

程序指令和数据分开存放的优点？3点。

3.AT&T汇编指令学习(GCC)

寄存器命名原则:

相比inter语法,AT&T语法格式要求所有的寄存器都必须加上取值符”%”.
操作码命令格式:
1. 源/目的操作数顺序:
  
  Intel语法格式中命令表示格式为:”opcode dest, src”; “操作码目标, 源”
  
  AT&T语法格式表示为:”opcode src, dest”; “操作码源, 目标”
2. 操作数长度标识:
  在AT&T语法中,通过在指令后添加后缀来指明该指令运算对象的尺寸.
  
  后缀 ‘b’ 指明运算对象是一个字节(byte)
  
  后缀 ‘w’ 指明运算对象是一个字(word)
  
  后缀 ‘l’ 指明运算对象是一个双字(long)
  
  Intel语法中指令’mov’在AT&T语法必须根据运算对象的实际情况写成:’movb’,’movw’或’movl’。
  
  注:若在AT&T中省略这些后缀,GAS将通过使用的寄存器大小来猜测指令的操作数长度.
3. 另外,
  ‘FAR’不是GAS的关键字,因此对far的call或jmp指令须加前缀 ‘l’, ‘far call’要写成 ‘lcall’ , ‘far jmp’ 要写成 ‘ljmp’ , ‘ret far’ 写成 ‘lret’。
常数/立即数的格式:
在AT&T语法中对立即数,须在其前加前缀 $ 来指明,而Inter语法则不需要。

另外, 在常数前也必须加一个前缀字符 * ,而Inter语法则也是不需要的。
内存寻址方式:
在Intel语法中,使用下面格式来表示存储器寻址方式:

SECTION:[BASE + INDEX*SCALE + DISP];段:[基地址+变址*比例因子+偏移量]

BASE是基地址索引寄存器(可以是任一通用寄存器),

INDEX是变址寄存器(除ESP外的任一通用寄存器),

SCALE是变址寄存器的比例常数,

DISP是基址/变址寄存器的位移量。

AT&T语法则使用不同的格式来表示寻址方式:

SECTION:DISP(BASE, INDEX, SCALE);段:偏移量(基地址,变址,比例因子)
标号 & 标识符:
所有的标号必须以一个字母,点或下划线开始,标号后加一个冒号表示标号的结束。

局部标号使用数字0-9后跟一个冒号,使用局部标号时要在数字后跟一个字符’b’(向后引用)或字符’f’(向前引用)。因为只能使用数字0-9作为局部标号名,所以最多只能定义10个局部标号.一个标识符能给它赋于一个值。(如:’TRUE=1’, 或者使用 .set 或 .equ 指令)。
基本的行内汇编格式:
asm("statements");

例如：asm(“nop”); asm(“movl %eax,%ebx”);

asm　和　_asm_是完全一样的.

如果有多行汇编，则每一行都要加上　“\n\t”
扩展的行内汇编格式:
asm ( "statements" : output_regs : input_regs : clobbered_regs);

冒号后的语句指明输入，输出和被改变的寄存器．
IA32整数寄存器：
常用指令：
1. 数据传送指令：move,push,pop;
2. 加载有效地址指令：leal;
3. 一元操作指令：inc(加1),dec(减1)，neg(取负)，not(取补);
4. 二元操作指令：add,sub,imul,idivl(有符号除法),xor,or,and;
5. 移位指令：sal(左移)，shl,sar(算数右移)，shr(逻辑右移)；
6. 跳转指令：jmp,je,jne,js,jns,jg,jl,ja,jb,jbe…

条件码寄存器(单个bit)：

cf(进位标志),zf(零标志),sf(符号标志),of(溢出标志)…

访问条件码指令：cmp,test,set…

t = a + b;
cf: (unsigned) t < (unsigned) a;//无符号溢出
zf: t == 0;//零
sf: t < 0;//负数
of: (a < 0 == b < 0) && (t < 0 != a < 0)//有符号溢出

4.内存对齐

为何要内存对齐
1. 平台原因(移植原因)：不是所有的硬件平台都能访问任意地址上的任意数据的；某些硬件平台只能在某些地址处取某些特定类型的数据，否则抛出硬件异常。
2. 性能原因：经过内存对齐后，CPU的内存访问速度大大提升。
内存对齐的规则

许多实际的计算机系统对基本类型数据在内存中存放的位置有限制，它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数，这就是所谓的内存对齐，而这个k则被称为该数据类型的对齐模数(alignment modulus)。当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1的整数，我们就称类型S的对齐要求比T强(严格)，而称T比S弱(宽松)。这种强制的要求一来简化了处理器与内存之间传输系统的设计，二来可以提升读取数据的速度。

比如这么一种处理器，它每次读写内存的时候都从某个8倍数的地址开始，一次读出或写入8个字节的数据，假如软件能保证double类型的数据都从8倍数地址开始，那么读或写一个double类型数据就只需要一次内存操作。否则，我们就可能需要两次内存操作才能完成这个动作，因为数据或许恰好横跨在两个符合对齐要求的8字节内存块上。某些处理器在数据不满足对齐要求的情况下可能会出错.

但是Intel的IA32架构的处理器则不管数据是否对齐都能正确工作。不过Intel奉劝大家，如果想提升性能，那么所有的程序数据都应该尽可能地对齐。
1. Win32平台下的微软C编译器(cl.exe for 80x86)在默认情况下采用如下的对齐规则:
  
  任何基本数据类型T的对齐模数就是T的大小，即sizeof(T)。比如对于double类型8字节)，就要求该类型数据的地址总是8的倍数，而char类型数据(1字节)则可以从任何一个地址开始。
2. Linux下的GCC对齐规则:
  char类型数据(1字节)起始位置任意,任何2字节大小的数据类型(比如short)的对齐模数是2，而其它所有超过2字节的数据类型(比如long,double)都以4为对齐模数。也就是说2字节数据类型（如short）的地址必须是2的倍数，而较大的数据类型（如int,double等）的地址必须是4的倍数，这意味着short类型的队形的地址最低位必须等于0，任何int类型的对象或指针的最低两位必须都是0.

5.Big-Endian大端模式和Little-Endian小端模式

定义

Little-Endian就是低位字节排放在内存的低地址端，高位字节排放在内存的高地址端。

Big-Endian就是高位字节排放在内存的低地址端，低位字节排放在内存的高地址端。

网络字节序：TCP/IP各层协议将字节序定义为Big-Endian，因此TCP/IP协议中使用的字节序通常称之为网络字节序.

高/低字节定义:在十进制中我们都说靠左边的是高位，靠右边的是低位，在其他进制也是如此。就拿 0x12345678来说，从高位到低位的字节依次是0x12、0x34、0x56和0x78.

例子分析:

unsigned int value = 0x12345678

1.Big-Endian: 低地址存放高位

栈底（高地址）
buf[3]	(0x78)	低位
buf[2]	(0x56)
buf[1]	(0x34)
buf[0]	(0x12)	高位
栈顶（低地址）

2.Little-Endian: 低地址存放低位

栈底（高地址）
buf[3]	(0x12)	高位
buf[2]	(0x34)
buf[1]	(0x56)
buf[0]	(0x78)	低位
栈顶（低地址）

在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)

内存地址	0x4000	0x4001	0x4002	0x4003
存放内容	0x78	0x56	0x34	0x12

在Big- endian模式CPU内存中的存放方式则为

内存地址	0x4000	0x4001	0x4002	0x4003
存放内容	0x12	0x34	0x56	0x78

注意：通常我们说的主机序（Host Order）就是遵循Little-Endian规则。所以当两台主机之间要通过TCP/IP协议进行通信的时候就需要调用相应的函数进行主机序（Little-Endian）和网络序（Big-Endian）的转换。

检查CPU是大端还是小端:

int checkCPU(void)
{
    union
    {
        int a;
        char b;
    }c;
    c.a = 1;
    return (c.b == 1);
}

6.过程调用

1. 栈帧结构

说明：

返回值在相对%ebp偏移量为4的位置；

第一个参数放在相对于%ebp偏移量为8的位置；

支持过程调用和返回的指令：

一个过程调用的整个汇编流程示意：

时间： 2024-10-31 21:52:53

深入理解计算机操作系统(笔记)的相关文章

深入理解计算机操作系统－－读书笔记－第八章异常

该文章是我对深入理解计算机操作系统这本书的读书笔记异常概念:异常就是控制流的突变,用来响应处理器状态中的某些变化,当处理器状态发生变化时,处理器正在执行某个当前指令,在处理器中状态编码为不同的位和信号,状态变化称之为事件,事件可能与当前指令有关如缺页,算术溢出,也可能无关定时器产生信号或者io请求异常处理完成的三种情况 1)处理程序将控制返回给当前指令 2)处理程序将控制返回给下一条指令 3)处理程序终止被中断的程序异常处理和过程调用的区别: 1)过程调用时,在跳转处理程序之前,处理器将返

一个简单的内存分配器-《深入理解计算机操作系统》

我相信很多人都知道<深入理解计算机操作系统>这本书,并且很多人都会对它研读.实际本人刚开始看的时候,只是加深了对操作系统的理解,别的到是没有感觉的到, 但是在看到公司的软件框架里面对于内存堆的管理,才发现和书上讲的异曲同工.于是乎,自己对利用隐式的空闲链表实现分配器做了总结,并且和自己想到的架构做了对比分析. 我们知道一个实际的分配器,不仅要考虑好吞吐率和内存利用率之间的平衡,还要考虑: ①空闲块组织:我们如何记录空闲块(一般刚开始会把一整段堆当做空闲块,然后再分割) ②放置:我们如何选择一个

《深入理解计算机操作系统》

第1章计算机系统漫游 1.1 信息就是比特+上下文1.2 程序被其他程序翻译成不同的格式1.3 了解编译系统如何工作是大有益处的1.4 处理器读并解释储存在存储器中的指令1.5 高速缓存1.6 形成层次结构的存储设备1.7 操作系统管理硬件1.8 利用网络系统和其他系统通信1.9 下一步1.10 小结第2章信息的表示和处理 2.1 信息存储2.2 整数表示2.3 整数运算2.4 浮点2.5 小结第3章程序的机器级表示 3.1 历史观点3.2 程序编码3.3 数据格式3.4 访问信息3.

深入理解计算机操作系统——第11章：全球IP地址

全球IP英特网 (1)每台英特网主机都运行实现TCPIP协议的软件. (2)英特网的客户端和服务器混合使用套接字接口函数和Unix IO函数来进行通信. (3)套接字函数典型的是作为陷入内核的系统调用来实现的,并调用各种内核模式的TCPIP函数. 13.3.1 IP地址

深入理解计算机操作系统——第3章：数组，异质的数据结构，指针

3.8 数组的分配和访问 (1)基本原则: int A[10] 首先,它在存储器中分配一个sizeof(int)*10字节的连续区域. 其次,它引入了标识符A.可以用A作为指向数组开头的指针.

深入理解计算机操作系统——第8章：进程控制

8.4 进程控制 8.4.1 获取进程ID (1)pid_t getpid(void)和pid_t gettpid(void)函数,其中返回的是pid_t整数值 (2)pid_t在types.h文件中被定义 8.4.2 创建和终止进程

深入理解计算机操作系统——第9章：缓存，存储器管理

9.3 虚拟存储器作为缓存工具 (1)虚拟存储器被组织为一个由存放在磁盘上的N个连续字节大小的单元组成的数组. (2)每个字节都有一个唯一的虚拟地址,作为数组索引 (3)磁盘上的内容被缓存到主存中 (4)磁盘上的数据被分割成块,作为磁盘与主存之间的传输单元虚拟页: (1)VM系统将虚拟存储器分割为虚拟页的大小的固定块 (2)每个虚拟页的大小为P=2^p 物理页: (1)类似的物理存储器也被分割为物理页,大小也为P称为页帧虚拟页面的集合: (1)未分配的:没有任何数据与它相关联,也就不占用任何

深入理解计算机操作系统——第8章：进程

进程: (1)进程的经典概念就是执行中的一个程序的实例. (2)系统中的每一个程序都是运行在进程的上下文中. (3)上下文:由程序正确运行所需的状态组成,这个状态包括:存放在存储器中的代码和数据,它的栈,通用目的寄存器, 程序计数器,环境变量,以及打开的文件描述符等等. 进程给程序提供的关键抽象: (1)独立的逻辑控制流:好像程序在运行时独占cpu处理器 (2)私有的地址空间:好像程序独占存储器一样. 逻辑控制流: 程序的运行时会有一系列的程序计数器(PC)的值,这些值唯一的对应着可执行程序的指

计算机操作系统——博文目录

深入理解计算机操作系统: 深入理解计算机操作系统——第3章:程序编码,过程调用(程序栈) 深入理解计算机操作系统——第3章:数组,异质的数据结构,指针深入理解计算机操作系统——第7章:静态链接深入理解计算机操作系统——第8章:异常深入理解计算机操作系统——第8章:进程深入理解计算机操作系统——第8章:进程控制深入理解计算机操作系统——第8章:信号深入理解计算机操作系统——第9章:物理和虚拟寻址,地址空间深入理解计算机操作系统——第10章:UNIX IO,打开,关闭,读写文件深入理