深入理解计算机操作系统(笔记)

1.实时系统概念

2.编译连接

3.AT&T汇编指令学习(GCC)

4.内存对齐

5.Big-Endian大端模式和Little-Endian小端模式

6.过程调用

1.实时系统概念

前后台系统

后台是各种面向硬件的程序,如中断,定时器,gpio等。

前台是:

main()
{

    while(1)
    {
        ;
    }
}

循环中不断调用各种函数实现功能。

代码临界段

指处理时不可分割的代码,一旦这部分代码运行就不可以打断、

为了确保代码能正常运行,进入临界段代码钱需要关中断,执行完后再开中断。

任务

一个任务也就是一个线程,是一个简单的程序。

任务间通信最简单的办法是使用数据共享结构。

任务间通信途径:1)全局变量;2)发消息给另一个任务。

任务切换(context switch)

基于优先级的内核

不可剥夺型内核,允许使用不可重入函数。

可剥夺型内核,,最高优先级的任务一就绪,总能得到CPU的使用权。,不能直接使用不可重入函数。

互斥条件

处理共享数据时保证互斥,最简单的办法是关中断和开中断。

信号量

一种约定机制。

就好像一把钥匙。任务要运行下去需要获得信号量,且信号量没有被占用。

死锁

两个任务相互等待对方释放资源。

同步

一个中断或者任务触发另一个任务。

邮箱

一种内存共享方式。

时钟节拍

特定的周期性中断,如同系统的心脏。

2.编译连接

目标文件的格式

可重定位文件:

包含代码和数据
可被用来链接成执行文件或者共享目标文件
linux(.o) windows(.obj)

可执行文件:

包含可以执行的程序
系统可以直接执行的文件
linux (ELF文件,无后缀) windows (.exe)

共享目标文件:

包含代码和数据
跟可重定位文件和共享目标文件链接,产生新的目标文件
动态连接器将共享目标文件与可执行文件结合,作为进程映像的一部分来运行
linux(.so) windows (.DLL)

核心转储文件

Linux(core dump)

目标文件的具体内容

file header

目标文件头

code section

程序指令(.code /.text)
存放程序代码程序

data section

程序数据(.data /.bss)
.data段 初始化的全局和局部静态变量
.bss段  未初始化的全局和局部静态变量
.bss(block started by symbol)符号预留块,没有内容不占据空间

othe section

还有可能包含的其他段,例 bank data .ect

程序指令和数据分开存放的优点?3点。

3.AT&T汇编指令学习(GCC)

  1. 寄存器命名原则:

    相比inter语法,AT&T语法格式要求所有的寄存器都必须加上取值符”%”.

  2. 操作码命令格式:
    1. 源/目的操作数顺序:

      Intel语法格式中命令表示格式为:”opcode dest, src”; “操作码 目标, 源”

      AT&T语法格式表示为:”opcode src, dest”; “操作码 源, 目标”

    2. 操作数长度标识:

      在AT&T语法中,通过在指令后添加后缀来指明该指令运算对象的尺寸.

      后缀 ‘b’ 指明运算对象是一个字节(byte)

      后缀 ‘w’ 指明运算对象是一个字(word)

      后缀 ‘l’ 指明运算对象是一个双字(long)

      Intel语法中指令’mov’在AT&T语法必须根据运算对象的实际情况写成:’movb’,’movw’或’movl’。

      注:若在AT&T中省略这些后缀,GAS将通过使用的寄存器大小来猜测指令的操作数长度.

    3. 另外,

      ‘FAR’不是GAS的关键字,因此对far的call或jmp指令须加前缀 ‘l’, ‘far call’要写成 ‘lcall’ , ‘far jmp’ 要写成 ‘ljmp’ , ‘ret far’ 写成 ‘lret’。

  3. 常数/立即数的格式:

    在AT&T语法中对立即数,须在其前加前缀 $ 来指明,而Inter语法则不需要。

    另外, 在常数前也必须加一个前缀字符 * ,而Inter语法则也是不需要的。

  4. 内存寻址方式:

    在Intel语法中,使用下面格式来表示存储器寻址方式:

    SECTION:[BASE + INDEX*SCALE + DISP];段:[基地址+变址*比例因子+偏移量]

    BASE是基地址索引寄存器(可以是任一通用寄存器),

    INDEX是变址寄存器(除ESP外的任一通用寄存器),

    SCALE是变址寄存器的比例常数,

    DISP是基址/变址寄存器的位移量。

    AT&T语法则使用不同的格式来表示寻址方式:

    SECTION:DISP(BASE, INDEX, SCALE);段:偏移量(基地址,变址,比例因子)

  5. 标号 & 标识符:

    所有的标号必须以一个字母,点或下划线开始,标号后加一个冒号表示标号的结束。

    局部标号使用数字0-9后跟一个冒号,使用局部标号时要在数字后跟一个字符’b’(向后引用)或字符’f’(向前引用)。因为只能使用数字0-9作为局部标号名,所以最多只能定义10个局部标号.一个标识符能给它赋于一个值。(如:’TRUE=1’, 或者使用 .set 或 .equ 指令)。

  6. 基本的行内汇编格式:

    asm("statements");

    例如:asm(“nop”); asm(“movl %eax,%ebx”);

    asm 和 _asm_是完全一样的.

    如果有多行汇编,则每一行都要加上 “\n\t”

  7. 扩展的行内汇编格式:

    asm ( "statements" : output_regs : input_regs : clobbered_regs);

    冒号后的语句指明输入,输出和被改变的寄存器.

  8. IA32整数寄存器:

  9. 常用指令:
    1. 数据传送指令:move,push,pop;
    2. 加载有效地址指令:leal;
    3. 一元操作指令:inc(加1),dec(减1),neg(取负),not(取补);
    4. 二元操作指令:add,sub,imul,idivl(有符号除法),xor,or,and;
    5. 移位指令:sal(左移),shl,sar(算数右移),shr(逻辑右移);
    6. 跳转指令:jmp,je,jne,js,jns,jg,jl,ja,jb,jbe…
  10. 条件码寄存器(单个bit):

    cf(进位标志),zf(零标志),sf(符号标志),of(溢出标志)…

    访问条件码指令:cmp,test,set…

    t = a + b;
    cf: (unsigned) t < (unsigned) a;//无符号溢出
    zf: t == 0;//零
    sf: t < 0;//负数
    of: (a < 0 == b < 0) && (t < 0 != a < 0)//有符号溢出
    

4.内存对齐

  1. 为何要内存对齐

    1. 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
    2. 性能原因:经过内存对齐后,CPU的内存访问速度大大提升。
  2. 内存对齐的规则

    许多实际的计算机系统对基本类型数据在内存中存放的位置有限制,它们会要求这些数据的首地址的值是某个数k(通常它为4或8)的倍数,这就是所谓的内存对齐,而这个k则被称为该数据类型的对齐模数(alignment modulus)。当一种类型S的对齐模数与另一种类型T的对齐模数的比值是大于1的整数,我们就称类型S的对齐要求比T强(严格),而称T比S弱(宽松)。这种强制的要求一来简化了处理器与内存之间传输系统的设计,二来可以提升读取数据的速度。

    比如这么一种处理器,它每次读写内存的时候都从某个8倍数的地址开始,一次读出或写入8个字节的数据,假如软件能保证double类型的数据都从8倍数地址开始,那么读或写一个double类型数据就只需要一次内存操作。否则,我们就可能需要两次内存操作才能完成这个动作,因为数据或许恰好横跨在两个符合对齐要求的8字节内存块上。某些处理器在数据不满足对齐要求的情况下可能会出错.

    但是Intel的IA32架构的处理器则不管数据是否对齐都能正确工作。不过Intel奉劝大家,如果想提升性能,那么所有的程序数据都应该尽可能地对齐。

    1. Win32平台下的微软C编译器(cl.exe for 80x86)在默认情况下采用如下的对齐规则:

      任何基本数据类型T的对齐模数就是T的大小,即sizeof(T)。比如对于double类型8字节),就要求该类型数据的地址总是8的倍数,而char类型数据(1字节)则可以从任何一个地址开始。

    2. Linux下的GCC对齐规则:

      char类型数据(1字节)起始位置任意,任何2字节大小的数据类型(比如short)的对齐模数是2,而其它所有超过2字节的数据类型(比如long,double)都以4为对齐模数。也就是说2字节数据类型(如short)的地址必须是2的倍数,而较大的数据类型(如int,double等)的地址必须是4的倍数,这意味着short类型的队形的地址最低位必须等于0,任何int类型的对象或指针的最低两位必须都是0.

5.Big-Endian大端模式和Little-Endian小端模式

定义

  1. Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
  2. Big-Endian就是高位字节排放在内存的低地址端,低位字节排放在内存的高地址端。
  3. 网络字节序:TCP/IP各层协议将字节序定义为Big-Endian,因此TCP/IP协议中使用的字节序通常称之为网络字节序.
  4. 高/低字节定义:在十进制中我们都说靠左边的是高位,靠右边的是低位,在其他进制也是如此。就拿 0x12345678来说,从高位到低位的字节依次是0x12、0x34、0x56和0x78.

例子分析:

unsigned int value = 0x12345678

1.Big-Endian: 低地址存放高位

    栈底 (高地址)
    buf[3]
    (0x78)
    低位
    buf[2]
    (0x56)
    buf[1]
    (0x34)
    buf[0]
    (0x12)
    高位
    栈顶 (低地址)

2.Little-Endian: 低地址存放低位

    栈底 (高地址)
    buf[3]
    (0x12)
    高位
    buf[2]
    (0x34)
    buf[1]
    (0x56)
    buf[0]
    (0x78)
    低位
    栈 顶 (低地址)

在Little-endian模式CPU内存中的存放方式(假设从地址0x4000开始存放)

内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x78 0x56 0x34 0x12

在Big- endian模式CPU内存中的存放方式则为

内存地址 0x4000 0x4001 0x4002 0x4003
存放内容 0x12 0x34 0x56 0x78

注意:通常我们说的主机序(Host Order)就是遵循Little-Endian规则。所以当两台主机之间要通过TCP/IP协议进行通信的时候就需要调用相应的函数进行主机序 (Little-Endian)和网络序(Big-Endian)的转换。

检查CPU是大端还是小端:

int checkCPU(void)
{
    union
    {
        int a;
        char b;
    }c;
    c.a = 1;
    return (c.b == 1);
}

6.过程调用

1. 栈帧结构

说明:

返回值在相对%ebp偏移量为4的位置;

第一个参数放在相对于%ebp偏移量为8的位置;

支持过程调用和返回的指令:

一个过程调用的整个汇编流程示意:

时间: 2024-10-31 21:52:53

深入理解计算机操作系统(笔记)的相关文章

深入理解计算机操作系统--读书笔记-第八章异常

该文章是我对深入理解计算机操作系统这本书的读书笔记 异常概念:异常就是控制流的突变,用来响应处理器状态中的某些变化,当处理器状态发生变化时,处理器正在执行某个当前指令,在处理器中状态编码为不同的位和信号,状态变化称之为事件,事件可能与当前指令有关如缺页,算术溢出,也可能无关定时器产生信号或者io请求 异常处理完成的三种情况 1)处理程序将控制返回给当前指令 2)处理程序将控制返回给下一条指令 3)处理程序终止被中断的程序 异常处理和过程调用的区别: 1)过程调用时,在跳转处理程序之前,处理器将返

一个简单的内存分配器-《深入理解计算机操作系统》

我相信很多人都知道<深入理解计算机操作系统>这本书,并且很多人都会对它研读.实际本人刚开始看的时候,只是加深了对操作系统的理解,别的到是没有感觉的到, 但是在看到公司的软件框架里面对于内存堆的管理,才发现和书上讲的异曲同工.于是乎,自己对利用隐式的空闲链表实现分配器做了总结,并且和自己想到的架构做了对比分析. 我们知道一个实际的分配器,不仅要考虑好吞吐率和内存利用率之间的平衡,还要考虑: ①空闲块组织:我们如何记录空闲块(一般刚开始会把一整段堆当做空闲块,然后再分割) ②放置:我们如何选择一个

《深入理解计算机操作系统》

第1章 计算机系统漫游 1.1 信息就是比特+上下文1.2 程序被其他程序翻译成不同的格式1.3 了解编译系统如何工作是大有益处的1.4 处理器读并解释储存在存储器中的指令1.5 高速缓存1.6 形成层次结构的存储设备1.7 操作系统管理硬件1.8 利用网络系统和其他系统通信1.9 下一步1.10 小结 第2章 信息的表示和处理 2.1 信息存储2.2 整数表示2.3 整数运算2.4 浮点2.5 小结 第3章 程序的机器级表示 3.1 历史观点3.2 程序编码3.3 数据格式3.4 访问信息3.

深入理解计算机操作系统——第11章:全球IP地址

全球IP英特网 (1)每台英特网主机都运行实现TCPIP协议的软件. (2)英特网的客户端和服务器混合使用套接字接口函数和Unix IO函数来进行通信. (3)套接字函数典型的是作为陷入内核的系统调用来实现的,并调用各种内核模式的TCPIP函数. 13.3.1 IP地址

深入理解计算机操作系统——第3章:数组,异质的数据结构,指针

3.8 数组的分配和访问 (1)基本原则: int A[10] 首先,它在存储器中分配一个sizeof(int)*10字节的连续区域. 其次,它引入了标识符A.可以用A作为指向数组开头的指针.

深入理解计算机操作系统——第8章:进程控制

8.4 进程控制 8.4.1 获取进程ID (1)pid_t getpid(void)和pid_t gettpid(void)函数,其中返回的是pid_t整数值 (2)pid_t在types.h文件中被定义 8.4.2 创建和终止进程

深入理解计算机操作系统——第9章:缓存,存储器管理

9.3 虚拟存储器作为缓存工具 (1)虚拟存储器被组织为一个由存放在磁盘上的N个连续字节大小的单元组成的数组. (2)每个字节都有一个唯一的虚拟地址,作为数组索引 (3)磁盘上的内容被缓存到主存中 (4)磁盘上的数据被分割成块,作为磁盘与主存之间的传输单元 虚拟页: (1)VM系统将虚拟存储器分割为虚拟页的大小的固定块 (2)每个虚拟页的大小为P=2^p 物理页: (1)类似的物理存储器也被分割为物理页,大小也为P称为页帧 虚拟页面的集合: (1)未分配的:没有任何数据与它相关联,也就不占用任何

深入理解计算机操作系统——第8章:进程

进程: (1)进程的经典概念就是执行中的一个程序的实例. (2)系统中的每一个程序都是运行在进程的上下文中. (3)上下文:由程序正确运行所需的状态组成,这个状态包括:存放在存储器中的代码和数据,它的栈,通用目的寄存器, 程序计数器,环境变量,以及打开的文件描述符等等. 进程给程序提供的关键抽象: (1)独立的逻辑控制流:好像程序在运行时独占cpu处理器 (2)私有的地址空间:好像程序独占存储器一样. 逻辑控制流: 程序的运行时会有一系列的程序计数器(PC)的值,这些值唯一的对应着可执行程序的指

计算机操作系统——博文目录

深入理解计算机操作系统: 深入理解计算机操作系统——第3章:程序编码,过程调用(程序栈) 深入理解计算机操作系统——第3章:数组,异质的数据结构,指针 深入理解计算机操作系统——第7章:静态链接 深入理解计算机操作系统——第8章:异常 深入理解计算机操作系统——第8章:进程 深入理解计算机操作系统——第8章:进程控制 深入理解计算机操作系统——第8章:信号 深入理解计算机操作系统——第9章:物理和虚拟寻址,地址空间 深入理解计算机操作系统——第10章:UNIX IO,打开,关闭,读写文件 深入理