[Operating System Labs] 我对Linux0.00中 head.s 的理解和注释

?21,
#  head.s contains the 32-bit startup code.
#  head.s 是32位的启动代码

#  Two L3 task multitasking. The code of tasks are in kernel area,
# 有两个L3(Level 3,即第三特权级,IA32提供给用户0-3,四个特权级,但是Linux0.11只使用了
# 0和3这两个特权级,表示用户态程序和内核态程序,内核-kernel)的多任务

#  just like the Linux. The kernel code is located at 0x10000.
# ……内核代码在0x10000,在boot.s中已经确定了呦~

#大家可能发现boot.s和head.s的代码有一点点不一样,这是因为boot.s使用的是as86汇编器
#而head.s使用的是GNU as汇编器,具体表现在
#    1~movl等操作的出现:当然还是mov的意思,l表示双字,w表示单字,b表示字节
#    2~movl等操作的源操作数和目的操作数位置,源在前而目的在后,与boot.s中的mov操作是相反的
#    3~立即数前必须加$,寄存器前必须加%
#    4~待续

.code32
# CODE32伪指令通知编译器,其后的指令序列为 32 位的 ARM 指令
SCRN_SEL    = 0x18
TSS0_SEL    = 0x20
LDT0_SEL    = 0x28
TSS1_SEL    = 0X30
LDT1_SEL    = 0x38

.global startup_32
.text
#.text表示文本段,通常包含可执行代码
startup_32:
    movl $0x10,%eax
    mov %ax,%ds
    # 将0x0010赋给ds
#    mov %ax,%es
    # 将0x0010赋给es,可是为啥被注释掉了呢……
    lss init_stack,%esp
    # lss mem,reg( mem低字->reg,mem高字->ss),这句的意思就是指让ss:esp指向init_stack
    # 我们不妨去看看init_stack到底存了一些什么东西:
    #    .long init_stack 表示了init_stack这个数据的地址
    #    .word 0x10 给ss赋值了
# 那么现在问题来了0x10是什么,是段选择符:0x10000,右移三位后正好选定gdt中的第2项。内核数据段。
# setup base fields of descriptors.
# 装载基本的域和描述符
    call setup_idt
        # 跳转到setup_idt去执行,请直接去setup_idt那里看后续注释
        # 普及一下call 和 jmp 两条指令的差别吧,call相当于这三条指令的连续作用“push cs”,“push eip” 和“jmp XXX”
        # 所以由call跳转过去执行的代码最后一定要用ret的方式回来
    call setup_gdt
        # 好的,我们回到这里了!
        # idt设置完了,我们去设置gdt,显然我们也要类比一下idt的设置方法来讨论gdt的设置方法
        # 我们猜测gdt需要做这几件事:1~ 填满gdt,2~ 构建gdtr应该有的值,然后一个lgdt指令,完事儿!
        # 好,我们进入setup_idt看看
    movl $0x10,%eax        # reload all the segment registers
        # 在改变gdt后,重新设置全部的段寄存器
    mov %ax,%ds        # after changing gdt.
    mov %ax,%es
    mov %ax,%fs
    mov %ax,%gs
    lss init_stack,%esp   
        # 把初始栈地址放给 ss:esp

# setup up timer 8253 chip.
    # 设置8253芯片,这个芯片具体的工作原理请看这里:http://baike.baidu.com/view/1684875.htm
    # 这个芯片就像我们小学期设计的CPU里的那个节拍发生器
    # 这一段的作用是让8253芯片每隔10ms就向CPU发送一个时钟中断请求
    movb $0x36, %al
    movl $0x43, %edx
    outb %al, %dx
    # 向%dx所示端口输出一个字节(b),值为%al中数据
    movl $11930, %eax        # timer frequency 100 HZ
    movl $0x40, %edx
    outb %al, %dx
    movb %ah, %al
    outb %al, %dx

# setup timer & system call interrupt descriptors.
    movl $0x00080000, %eax
    movw $timer_interrupt, %ax
        # 这两条指令就把 %eax设置成了 0x0008~timer_interrupt(请把“~”看成是地址的链接符……)的地址,
        # 还是代码段中偏移为timer_interrupt的地方
        # 但是究竟0x0008和0x0010有什么区别呢?
        # 显然我们知道0x0008和0x0010分别是代码段和数据段的段选择符,可是代码段和数据段分别在哪里?
        # 去gdt看看,跳到gdt去~
        # ok可以回来了!现在我们继续,去看看timer_interrupt是干什么的?
    movw $0x8E00, %dx
        # 将%dx置为0x8E00
    movl $0x08, %ecx              # The PC default timer int.
        # 将%ecx置为0x08,Linus注释说是PC的默认时钟中断
        # 还不清楚是啥意思……等一会再看……
    lea idt(,%ecx,8), %esi
        # 这条指令是什么意思呢,是将%ecx*8+idt的地址放入%esi中去
    movl %eax,(%esi)
        # 再把%eax的值放入%esi所指的内存区域
        # %eax里面是什么呢?是0x0008~timer_interrupt的地址
    movl %edx,4(%esi)
        # 把%edx放在这个中断描述符的高八位
    movw $system_interrupt, %ax
        # 设置完了时钟中断之后,我们再去设置系统中断
    movw $0xef00, %dx
    movl $0x80, %ecx
        # 0x80是什么!?系统调用的中断号……
    lea idt(,%ecx,8), %esi
    movl %eax,(%esi)
    movl %edx,4(%esi)
        # 上面的几个步骤跟设置时钟中断的方式是一样的

# unmask the timer interrupt.
#    movl $0x21, %edx
#    inb %dx, %al
#    andb $0xfe, %al
#    outb %al, %dx

# Move to user mode (task 0)
    # 然后就要跳转到用户态去执行了
    pushfl
        # pushfl是push flags long的简写,将标志寄存器压栈,双字四字节
    andl $0xffffbfff, (%esp)
        # 1111111111111111 1011 1111 1111 1111
        # andl指令专门用来清零特定的位
        # 这里它的用处我猜不透啊……在完全剖析那本书上也没写……
    popfl
        # 然后又pop了标志位,难道andl操作会改变标志位?
    movl $TSS0_SEL, %eax
        # $TSS0_SEL是在一开始就设定好的,它的值是0x20
    ltr %ax
        # ltr--load task register,装载任务寄存器
        # 那么现在是装载了任务0的,段选择符0x20,右移三位变成二进制的100,表示gdt表的第4项
    movl $LDT0_SEL, %eax
        # 想执行任务0,除了要设置tr以外还要设置ldt
    lldt %ax
        # 好的,这里就设置完成了。
    movl $0, current
        # 把一个叫做current的变量设置成0
    sti
        # 在head.s中关闭的中断终于可以打开了
        # 现在栈里有什么?什么都没有。
    pushl $0x17
    pushl $init_stack
    pushfl
    pushl $0x0f
    pushl $task0
        # 好,这里我们在栈中push了很多东西,分别来看一看
        # 栈顶项 $task0的地址
        # 第二项 0x0f(这是什么?)
        # 第三项 全部标志寄存器
        # 第四项 初始栈的地址
        # 第五项 0x17(这又是什么?)
    iret
        # 借鉴一个网上的博客对这个指令的解释,他先引用了IA32手册上对IRET指令的解释:
            # the IRET instruction pops the return instruction pointer, return code segment selector,
            # 译:IRET指令一一对应地弹出IP指令指针和CS代码段选择符
            # and EFLAGS image from the stack to the EIP, CS, and EFLAGS registers, respectively,
            # 译:以及EFLAGS的值到EIP,CS和EFLAGS寄存器中
            # and then resumes execution of the interrupted program or procedure.
            # 译:然后继续执行中断的程序
            # If the return is to another privilege level, the IRET instruction also pops the stack pointer and SS from the stack,
            # 译:如果返回到另一个特权级,那么这个指令再继续执行前还要弹出栈指针和SS寄存器
            # before resuming program execution.
        # 显然,这里要转换特权级,就要弹出五项,一一对应
        # EIP -> $task0的地址
        # CS -> 0x0f (00001111),特权级3的ldt的第一项,任务0
        # EFLAGS -> EFLAGS 这个不用变
        # ESP -> $init_stack的地址
        # SS -> 0x17 (00010111),特权级3的ldt的第二项,数据段,也做堆栈段的选择符
        # 到这里,就跳到任务0去执行了……我们直接去任务0!
/****************************************/
setup_gdt:
    # 惊呆了有木有,好短啊……然后我们看看这个lgdt_opcode可能会提供给我们什么信息!
    # 我们刚刚的猜测第二步已经有了,lgdt指令就在这里。我们还是先猜测lgdt_opcode里有啥?
    # 无非就是长度,基址呗~ 去看看。
    lgdt lgdt_opcode
    ret

setup_idt:
    lea ignore_int,%edx
        # lea:load effective address,将变量的地址从内存中取出并放入寄存器
    movl $0x00080000,%eax
    movw %dx,%ax        /* selector = 0x0008 = cs */
        #将%eax设置为0x0008-ignore_int地址
    movw $0x8E00,%dx    /* interrupt gate - dpl=0, present */
        #中断门类型,dpl设置为0
    lea idt,%edi
        # 将idt的地址存入%edi中去
    mov $256,%ecx
        # %ecx通常在程序中充当循环语句执行次数计数器的角色,
        # 比如 loop指令和rep指令每次执行时都要%ecx减一,%ecx为零时停止循环
        # 所以当遇到%ecx时,可以考虑它是不是又来当循环计数器了,结果在dec那一句可以看到
rp_sidt:
    movl %eax,(%edi)
        # 将%edi地址中的数据改为%eax中的数据,就是这个ignore_int代码标记的地址,
        # 也就是每一个idt项的低四位
    movl %edx,4(%edi)
        # 首先说一下4(%edi)的意思是[%edi+4]这个内存地址里的数据,
        # 其次,这表示与上面同一个idt描述项的高四位。
        # 这一通循环的目的是把256个idt描述项都设置成一样的,即都是由ignore_int来处理。
        # 剧透,怎么处理?看名字可以知道:ignore_int——通过ignore的方式来处理……
    addl $8,%edi
        # 然后%edi加8,进入下一个idt描述符表去修改
    dec %ecx
        # 每执行一次都要修改%ecx,dec的意思是%ecx减一
    jne rp_sidt
        # %ecx 若不为零,则跳回rp_sidt继续执行,rp_sidt(repeat setup idt)
    lidt lidt_opcode
        # 当256项都执行完了,所有中断处理程序全部指向ignore_int了之后,高高兴兴地把lidt_opcode置成idtr
        # lidt_opcode把长度啊,基地址啥的都设好了
    ret
        # 执行完了这一通,可以回去了到call setup_idt这条之后的那一条去执行了
        # 那么回去之前,我们考虑一下究竟这个setup_idt都做了些什么呢?
        # 1~ 256个entries的表统统都填写上了这个ignore_int的处理函数
        # 2~ 把lidt_opcode置给了idtr,然后高高兴兴地ret了……

# -----------------------------------
write_char:
    push %gs
    pushl %ebx
#    pushl %eax
    mov $SCRN_SEL, %ebx
    mov %bx, %gs
    movl scr_loc, %ebx
    shl $1, %ebx
    movb %al, %gs:(%ebx)
    shr $1, %ebx
    incl %ebx
    cmpl $2000, %ebx
    jb 1f
    movl $0, %ebx
1:    movl %ebx, scr_loc
#    popl %eax
    popl %ebx
    pop %gs
    ret

/***********************************************/
/* This is the default interrupt "handler" :-) */
.align 2
ignore_int:
    push %ds
    pushl %eax
    movl $0x10, %eax
    mov %ax, %ds
    movl $67, %eax            /* print ‘C‘ */
    call write_char
    popl %eax
    pop %ds
    iret

/* Timer interrupt handler */
.align 2
timer_interrupt:
    push %ds
    pushl %eax
    movl $0x10, %eax
    mov %ax, %ds
        # 将%ds设置为0x10
    movb $0x20, %al
        # 将%al设置为0x20
    outb %al, $0x20
    movl $1, %eax
        # 将%eax置为1
    cmpl %eax, current
        # 将current与%eax进行比较,如果相等则跳转到1去执行
    je 1f
    movl %eax, current
        # 若不相等,证明目前current为0,那么就去跳转到TSS0那里去执行
    ljmp $TSS1_SEL, $0
    jmp 2f
1:    movl $0, current
        #在这里将current设置为0
    ljmp $TSS0_SEL, $0
        # ljmp的意思是跳转到段选择子,段内偏移
        # jmpi的意思是跳转到段内偏移,段选择子
        # 这里的意思是跳转到TSS0那里去执行
2:    popl %eax
    pop %ds
        # 最后无论如何都会pop,完事儿~
    iret
        # 这里才是真的完事儿了~
        # 用一个最可爱的IRET指令标志注释的结束,再见观众朋友们~

/* system call handler */
.align 2
system_interrupt:
# 系统中断
    push %ds
    pushl %edx
    pushl %ecx
    pushl %ebx
    pushl %eax
        # 保存寄存器
    movl $0x10, %edx
    mov %dx, %ds
        # 将%ds置0x10
    call write_char
        # 调用这个write_char函数,我们不去分析write_char是干啥的了,
        # 根据名称可知,是写一个字符
    popl %eax
    popl %ebx
    popl %ecx
    popl %edx
    pop %ds
        # 弹出各个寄存器
    iret
        # 中断返回
# 可见,这个系统中断做的事情就是把当前任务对应的字符打印出来,
# task0打印“A”,task1打印“B”
# 但是一开始我们看到的是task0是一个死循环,task1还没有执行过?
# 似乎……只有时钟中断可以让task1得到执行了!

/*********************************************/
current:.long 0
scr_loc:.long 0

.align 2
lidt_opcode:
    .word 256*8-1        # idt contains 256 entries
    .long idt        # This will be rewrite by code.
lgdt_opcode:
    # 长度16位,在这里,end_gdt标签位置减去gdt标签位置再加1。
    .word (end_gdt-gdt)-1    # so does gdt
    # 基址32位,gdt的基址就叫gdt。好,我们去看看写了什么……
    .long gdt        # This will be rewrite by code.

.align 8
    # 这个指令我们汇编课上学过,忘记的去百度一下哦~
idt:    .fill 256,8,0        # idt is uninitialized
# fill伪指令:.fill repeat,size,value 本命令生成size个字节的repeat个副本。
# 各个副本中的内容取自一个8字节长的数。最高4个字节为零,最低的4个字节是value,
# 那么这个指令的意思就是复制256个8字节大小的量,每项都填充成为0
# 看完后面那通代码可知,这里的fill指令纯粹就是为了占位置的,嗯对一定是这样。

gdt:    .quad 0x0000000000000000    /* NULL descriptor */
        # 出现了一个我们没有见过的伪指令,但是它的意思跟 .word是一类的,表示定义一个多长的空间
        # quad是多长呢?联想“quadra kill”……肯定跟四什么什么有关,
        # 再看后面串的长度,可见这个四是四个字的意思。.quad就是规定了后面的八个字节(四个字)的数据的伪指令
    .quad 0x00c09a00000007ff    /* 8Mb 0x08, base = 0x00000 */
        # 这个0x00c09a00000007ff是怎么组成的呢?
        # 显然从左到右是从高到低,我们按照每二位16进制数一拆分
        # 0x  00               c09a            00
        #     基地址的31-24位  一些状态标识位  基地址的23-16位
        #     0000               07ff
        #     基地址的15-0位   段限长,2047个字节
        # 可见这个基地址是0x00000000,与下面这个表项所示一样,说明代码段和数据段是重叠的~
    .quad 0x00c09200000007ff    /* 8Mb 0x10 */
    .quad 0x00c0920b80000002    /* screen 0x18 - for display */
        # 上面一共有四项,gdt第一项还是照例空缺
        # 第四项是显示内存段的描述符,段选择符是0x18……怎么算的就不讲了~
    .word 0x0068, tss0, 0xe900, 0x0    # TSS0 descr 0x20
        # 任务0的TSS段,段选择符0x20
    .word 0x0040, ldt0, 0xe200, 0x0    # LDT0 descr 0x28
        # 任务0的LDT段,段选择符0x28
    .word 0x0068, tss1, 0xe900, 0x0    # TSS1 descr 0x30
        # 任务1的TSS段,段选择符0x30
    .word 0x0040, ldt1, 0xe200, 0x0    # LDT1 descr 0x38
        # 任务1的LDT段,段选择符0x38
end_gdt:
    .fill 128,4,0
        # 哦最后这个是做啥的?
        # 猜~
    # 好的看到这里我们可以回去了,回到call setup_gdt那里!
init_stack:                          # Will be used as user stack for task0.
    .long init_stack
    .word 0x10

/*************************************/
.align 8
ldt0:    .quad 0x0000000000000000
    .quad 0x00c0fa00000003ff    # 0x0f, base = 0x00000
    .quad 0x00c0f200000003ff    # 0x17

tss0:    .long 0             /* back link */
    .long krn_stk0, 0x10        /* esp0, ss0 */
    .long 0, 0, 0, 0, 0        /* esp1, ss1, esp2, ss2, cr3 */
    .long 0, 0, 0, 0, 0        /* eip, eflags, eax, ecx, edx */
    .long 0, 0, 0, 0, 0        /* ebx esp, ebp, esi, edi */
    .long 0, 0, 0, 0, 0, 0         /* es, cs, ss, ds, fs, gs */
    .long LDT0_SEL, 0x8000000    /* ldt, trace bitmap */

.fill 128,4,0
krn_stk0:
#    .long 0

/************************************/
.align 8
ldt1:    .quad 0x0000000000000000
    .quad 0x00c0fa00000003ff    # 0x0f, base = 0x00000
    .quad 0x00c0f200000003ff    # 0x17

tss1:    .long 0             /* back link */
    .long krn_stk1, 0x10        /* esp0, ss0 */
    .long 0, 0, 0, 0, 0        /* esp1, ss1, esp2, ss2, cr3 */
    .long task1, 0x200        /* eip, eflags */
    .long 0, 0, 0, 0        /* eax, ecx, edx, ebx */
    .long usr_stk1, 0, 0, 0        /* esp, ebp, esi, edi */
    .long 0x17,0x0f,0x17,0x17,0x17,0x17 /* es, cs, ss, ds, fs, gs */
    .long LDT1_SEL, 0x8000000    /* ldt, trace bitmap */

.fill 128,4,0
krn_stk1:

/************************************/
task0:
    movl $0x17, %eax
    movw %ax, %ds
        # %ds置为0x17,
    movb $65, %al              /* print ‘A‘ */
        # %al置为ASCII码的65号,“A”
    int $0x80
        # 调用int $0x80,这个中断在之前就已经写好了,
        # 我们可以去看看system_interrupt,这个就是0x80中断的处理程序,
        # 为什么?在上面写了,请好好的找一找~
        # 然后我们就去这个处理程序看看去,我们目前知道的是,ds为0x17,al为65
        #???
    movl $0xfff, %ecx
        # 将%ecx改为0xfff,意思是一直执行这个task0,因为loop没执行一次会减ecx的值
1:    loop 1b
        # b和f的意思分别是向前跳转和向后跳转的意思
    jmp task0
# 先在我们只看到task0的工作,那么task1何时工作呢?
# 在前面我们记得时钟中断在每10ms时8253芯片会发送一个时钟中断,
# 我们还没有分析这个时钟中断是做什么的。
task1:
    movl $0x17, %eax
    movw %ax, %ds
    movb $66, %al              /* print ‘B‘ */
    int $0x80
    movl $0xfff, %ecx
1:    loop 1b
    jmp task1
    # 不解释……跟task0差不多……
    .fill 128,4,0
usr_stk1:

时间: 2024-11-12 12:18:38

[Operating System Labs] 我对Linux0.00中 head.s 的理解和注释的相关文章

[Operationg System Labs] 我对 Linux0.00 中 boot.s的理解和注释

(如有错误请立即指正,么么哒!) !    boot.s!! It then loads the system at 0x10000, using BIOS interrupts. Thereafter! it disables all interrupts, changes to protected mode, and calls the ! 从0X10000开始,使用BIOS中断加载系统.! 使所有的中断失灵,转入保护模式…… BOOTSEG = 0x07c0             ! b

vmdk通过v2v转换后operating system not found

对vmware workstion 11里的win2K3虚拟机,通过ovf再virt-v2v到kvm,启动的时候就出现Error loading operating system. 查资料显示跟硬盘引导有关,试过各种办法,如修复mbr,激活分区,使用2k3引导盘进行 fixboot,fixmbr.试过名种方法都无果. ESX下的就没有问题. workstation下的ide转换也没有问题.就是SCSI硬盘报Error loading operating system. 最后只能在workstat

VMware vSphere Client中启动虚拟机提示No boot filename received/Operating System not found解决方法

昨天下载安装 .NET Framework 3.5 SP1解决了VMware vSphere Client安装问题后,今天需要远程连接服务器搭建一台虚拟机. 根据指引步骤进行下一步.下一步的操作完成后,点击启动虚拟机.本以为万事大吉了,谁成想打开控制台却发现异常: No boot filename received Operating System not found. 就连关闭虚拟机时也弹出警告提示: 于是就去摘要信息中查看VMware Tools信息,果然 那要如何解决呢?回想之前的操作,都

Operating System Engineering

Operating System Engineering Course Meeting Times Lectures: 2 sessions / week, 1.5 hours / session Prerequisites 6.033 Computer System Engineering 6.170 Software Studio 6.004 Computation Structures Description 6.828 Operating System Engineering studi

ROS是Robot Operating System

ROS是Robot Operating System 机器人操作系统ROS | 简介篇 同样,从个人微信公众号Nao(ID:qRobotics)搬运. 前言 先放一个ROS Industrial一周年剪辑视频. ROS已经发布八周年了,在国外科研机构中非常受欢迎.目前,以美国西南研究院为首的几位大佬开始尝试将ROS应用在工业机器人中,上面这个视频就是ROS-I项目一周年的进展情况. 为了说明讲清楚ROS,我就从ROS是什么,为什么使用ROS,如何使用ROS三个方面展开. △出自今年<机器人视觉与

osquery An Operating System Instrumentation Framewor

catalog 1. Getting Started 2. install guide for OS X and Linux 3. Features Overview 4. Logging 5. query example 1. Getting Started osquery is an operating system instrumentation framework for OS X and Linux. The tools make low-level operating system

CREATE FILE encountered operating system error 5(Access is denied.)

这篇博文主要演示"CREATE FILE encountered operating system error 5(Access is denied.)"错误如出现的原因(当然只是导致这个错误出现的一种场景而已)和如何解决这个问题以及一些不解的迷惑. 实验环境: 操作系统版本: Windows Server 2012 SP2 数据库的版本:Microsoft SQL Server 2014 - 12.0.2000.8 如下所示,SQL Server Database Services

《modern operating system》 chapter 3 MEMORY MANAGEMENT 笔记

MEMORY MANAGEMENT The part of the operating system that manages (part of) the memory hierarchy is called thememory manager 这章感觉有点多...80 多页..看完都看了两天多,做笔记就更有点不想...有点懒了..但是要坚持下去,可以自己较劲 对于内存的抽象,最简单的抽象就是...没有抽象 和第一次看不一样,把summary放在最前面,对整个mamory management的

Linux启动报错missing operating system

用UltraISO制作了一个Red Hat Enterprise Linux Server release 5.7系统的U盘启动盘,然后在一台PC上安装,由于安装过程中在干别的事情,有些选项没有细看.安装完成后,启动系统时报错:missing operating system. 插上U盘,在BIOS里面选择从U盘启动就能正常启动系统,搜索了一些资料后,发现在安装LINUX操作系统过程中,由于使用的是U盘方式安装,引导的grub信息被默认安装到了U盘中(很多时候没有注意到这个),拔除U盘后,启动过