[Operating System Labs] 我对Linux0.00中 head.s 的理解和注释 / 憋错料

？21，
# head.s contains the 32-bit startup code.
# head.s 是32位的启动代码

# Two L3 task multitasking. The code of tasks are in kernel area,
# 有两个L3（Level 3，即第三特权级，IA32提供给用户0-3，四个特权级，但是Linux0.11只使用了
# 0和3这两个特权级，表示用户态程序和内核态程序，内核-kernel）的多任务

# just like the Linux. The kernel code is located at 0x10000.
# ……内核代码在0x10000，在boot.s中已经确定了呦~

#大家可能发现boot.s和head.s的代码有一点点不一样，这是因为boot.s使用的是as86汇编器
#而head.s使用的是GNU as汇编器，具体表现在
#    1~movl等操作的出现：当然还是mov的意思，l表示双字，w表示单字，b表示字节
#    2~movl等操作的源操作数和目的操作数位置，源在前而目的在后，与boot.s中的mov操作是相反的
#    3~立即数前必须加$,寄存器前必须加%
#    4~待续

.code32
# CODE32伪指令通知编译器，其后的指令序列为 32 位的 ARM 指令
SCRN_SEL    = 0x18
TSS0_SEL    = 0x20
LDT0_SEL    = 0x28
TSS1_SEL    = 0X30
LDT1_SEL    = 0x38

.global startup_32
.text
#.text表示文本段，通常包含可执行代码
startup_32:
    movl $0x10,%eax
    mov %ax,%ds
    # 将0x0010赋给ds
#    mov %ax,%es
    # 将0x0010赋给es，可是为啥被注释掉了呢……
    lss init_stack,%esp
    # lss mem,reg（ mem低字->reg，mem高字->ss），这句的意思就是指让ss:esp指向init_stack
    # 我们不妨去看看init_stack到底存了一些什么东西：
    #    .long init_stack 表示了init_stack这个数据的地址
    #    .word 0x10 给ss赋值了
# 那么现在问题来了0x10是什么，是段选择符：0x10000，右移三位后正好选定gdt中的第2项。内核数据段。
# setup base fields of descriptors.
# 装载基本的域和描述符
    call setup_idt
        # 跳转到setup_idt去执行，请直接去setup_idt那里看后续注释
        # 普及一下call 和 jmp 两条指令的差别吧，call相当于这三条指令的连续作用“push cs”，“push eip” 和“jmp XXX”
        # 所以由call跳转过去执行的代码最后一定要用ret的方式回来
    call setup_gdt
        # 好的，我们回到这里了！
        # idt设置完了，我们去设置gdt，显然我们也要类比一下idt的设置方法来讨论gdt的设置方法
        # 我们猜测gdt需要做这几件事：1~ 填满gdt，2~ 构建gdtr应该有的值，然后一个lgdt指令，完事儿！
        # 好，我们进入setup_idt看看
    movl $0x10,%eax        # reload all the segment registers
        # 在改变gdt后，重新设置全部的段寄存器
    mov %ax,%ds        # after changing gdt.
    mov %ax,%es
    mov %ax,%fs
    mov %ax,%gs
    lss init_stack,%esp
        # 把初始栈地址放给 ss:esp

# setup up timer 8253 chip.
    # 设置8253芯片，这个芯片具体的工作原理请看这里：http://baike.baidu.com/view/1684875.htm
    # 这个芯片就像我们小学期设计的CPU里的那个节拍发生器
    # 这一段的作用是让8253芯片每隔10ms就向CPU发送一个时钟中断请求
    movb $0x36, %al
    movl $0x43, %edx
    outb %al, %dx
    # 向%dx所示端口输出一个字节（b），值为%al中数据
    movl $11930, %eax        # timer frequency 100 HZ
    movl $0x40, %edx
    outb %al, %dx
    movb %ah, %al
    outb %al, %dx

# setup timer & system call interrupt descriptors.
    movl $0x00080000, %eax
    movw $timer_interrupt, %ax
        # 这两条指令就把 %eax设置成了 0x0008~timer_interrupt（请把“~”看成是地址的链接符……）的地址，
        # 还是代码段中偏移为timer_interrupt的地方
        # 但是究竟0x0008和0x0010有什么区别呢？
        # 显然我们知道0x0008和0x0010分别是代码段和数据段的段选择符，可是代码段和数据段分别在哪里？
        # 去gdt看看，跳到gdt去~
        # ok可以回来了！现在我们继续，去看看timer_interrupt是干什么的？
    movw $0x8E00, %dx
        # 将%dx置为0x8E00
    movl $0x08, %ecx              # The PC default timer int.
        # 将%ecx置为0x08，Linus注释说是PC的默认时钟中断
        # 还不清楚是啥意思……等一会再看……
    lea idt(,%ecx,8), %esi
        # 这条指令是什么意思呢，是将%ecx*8+idt的地址放入%esi中去
    movl %eax,(%esi)
        # 再把%eax的值放入%esi所指的内存区域
        # %eax里面是什么呢？是0x0008~timer_interrupt的地址
    movl %edx,4(%esi)
        # 把%edx放在这个中断描述符的高八位
    movw $system_interrupt, %ax
        # 设置完了时钟中断之后，我们再去设置系统中断
    movw $0xef00, %dx
    movl $0x80, %ecx
        # 0x80是什么！？系统调用的中断号……
    lea idt(,%ecx,8), %esi
    movl %eax,(%esi)
    movl %edx,4(%esi)
        # 上面的几个步骤跟设置时钟中断的方式是一样的

# unmask the timer interrupt.
#    movl $0x21, %edx
#    inb %dx, %al
#    andb $0xfe, %al
#    outb %al, %dx

# Move to user mode (task 0)
    # 然后就要跳转到用户态去执行了
    pushfl
        # pushfl是push flags long的简写，将标志寄存器压栈，双字四字节
    andl $0xffffbfff, (%esp)
        # 1111111111111111 1011 1111 1111 1111
        # andl指令专门用来清零特定的位
        # 这里它的用处我猜不透啊……在完全剖析那本书上也没写……
    popfl
        # 然后又pop了标志位，难道andl操作会改变标志位？
    movl $TSS0_SEL, %eax
        # $TSS0_SEL是在一开始就设定好的，它的值是0x20
    ltr %ax
        # ltr--load task register，装载任务寄存器
        # 那么现在是装载了任务0的，段选择符0x20，右移三位变成二进制的100，表示gdt表的第4项
    movl $LDT0_SEL, %eax
        # 想执行任务0，除了要设置tr以外还要设置ldt
    lldt %ax
        # 好的，这里就设置完成了。
    movl $0, current
        # 把一个叫做current的变量设置成0
    sti
        # 在head.s中关闭的中断终于可以打开了
        # 现在栈里有什么？什么都没有。
    pushl $0x17
    pushl $init_stack
    pushfl
    pushl $0x0f
    pushl $task0
        # 好，这里我们在栈中push了很多东西，分别来看一看
        # 栈顶项 $task0的地址
        # 第二项 0x0f（这是什么？）
        # 第三项全部标志寄存器
        # 第四项初始栈的地址
        # 第五项 0x17（这又是什么？）
    iret
        # 借鉴一个网上的博客对这个指令的解释，他先引用了IA32手册上对IRET指令的解释:
            # the IRET instruction pops the return instruction pointer, return code segment selector,
            # 译：IRET指令一一对应地弹出IP指令指针和CS代码段选择符
            # and EFLAGS image from the stack to the EIP, CS, and EFLAGS registers, respectively,
            # 译：以及EFLAGS的值到EIP，CS和EFLAGS寄存器中
            # and then resumes execution of the interrupted program or procedure.
            # 译：然后继续执行中断的程序
            # If the return is to another privilege level, the IRET instruction also pops the stack pointer and SS from the stack,
            # 译：如果返回到另一个特权级，那么这个指令再继续执行前还要弹出栈指针和SS寄存器
            # before resuming program execution.
        # 显然，这里要转换特权级，就要弹出五项，一一对应
        # EIP -> $task0的地址
        # CS -> 0x0f (00001111)，特权级3的ldt的第一项，任务0
        # EFLAGS -> EFLAGS 这个不用变
        # ESP -> $init_stack的地址
        # SS -> 0x17 (00010111)，特权级3的ldt的第二项，数据段，也做堆栈段的选择符
        # 到这里，就跳到任务0去执行了……我们直接去任务0！
/****************************************/
setup_gdt:
    # 惊呆了有木有，好短啊……然后我们看看这个lgdt_opcode可能会提供给我们什么信息！
    # 我们刚刚的猜测第二步已经有了，lgdt指令就在这里。我们还是先猜测lgdt_opcode里有啥？
    # 无非就是长度，基址呗~ 去看看。
    lgdt lgdt_opcode
    ret

setup_idt:
    lea ignore_int,%edx
        # lea：load effective address，将变量的地址从内存中取出并放入寄存器
    movl $0x00080000,%eax
    movw %dx,%ax        /* selector = 0x0008 = cs */
        #将%eax设置为0x0008-ignore_int地址
    movw $0x8E00,%dx    /* interrupt gate - dpl=0, present */
        #中断门类型，dpl设置为0
    lea idt,%edi
        # 将idt的地址存入%edi中去
    mov $256,%ecx
        # %ecx通常在程序中充当循环语句执行次数计数器的角色，
        # 比如 loop指令和rep指令每次执行时都要%ecx减一，%ecx为零时停止循环
        # 所以当遇到%ecx时，可以考虑它是不是又来当循环计数器了，结果在dec那一句可以看到
rp_sidt:
    movl %eax,(%edi)
        # 将%edi地址中的数据改为%eax中的数据，就是这个ignore_int代码标记的地址，
        # 也就是每一个idt项的低四位
    movl %edx,4(%edi)
        # 首先说一下4(%edi)的意思是[%edi+4]这个内存地址里的数据，
        # 其次，这表示与上面同一个idt描述项的高四位。
        # 这一通循环的目的是把256个idt描述项都设置成一样的，即都是由ignore_int来处理。
        # 剧透，怎么处理？看名字可以知道：ignore_int——通过ignore的方式来处理……
    addl $8,%edi
        # 然后%edi加8，进入下一个idt描述符表去修改
    dec %ecx
        # 每执行一次都要修改%ecx，dec的意思是%ecx减一
    jne rp_sidt
        # %ecx 若不为零，则跳回rp_sidt继续执行，rp_sidt（repeat setup idt）
    lidt lidt_opcode
        # 当256项都执行完了，所有中断处理程序全部指向ignore_int了之后，高高兴兴地把lidt_opcode置成idtr
        # lidt_opcode把长度啊，基地址啥的都设好了
    ret
        # 执行完了这一通，可以回去了到call setup_idt这条之后的那一条去执行了
        # 那么回去之前，我们考虑一下究竟这个setup_idt都做了些什么呢？
        # 1~ 256个entries的表统统都填写上了这个ignore_int的处理函数
        # 2~ 把lidt_opcode置给了idtr，然后高高兴兴地ret了……

# -----------------------------------
write_char:
    push %gs
    pushl %ebx
#    pushl %eax
    mov $SCRN_SEL, %ebx
    mov %bx, %gs
    movl scr_loc, %ebx
    shl $1, %ebx
    movb %al, %gs:(%ebx)
    shr $1, %ebx
    incl %ebx
    cmpl $2000, %ebx
    jb 1f
    movl $0, %ebx
1:    movl %ebx, scr_loc
#    popl %eax
    popl %ebx
    pop %gs
    ret

/***********************************************/
/* This is the default interrupt "handler" :-) */
.align 2
ignore_int:
    push %ds
    pushl %eax
    movl $0x10, %eax
    mov %ax, %ds
    movl $67, %eax            /* print ‘C‘ */
    call write_char
    popl %eax
    pop %ds
    iret

/* Timer interrupt handler */
.align 2
timer_interrupt:
    push %ds
    pushl %eax
    movl $0x10, %eax
    mov %ax, %ds
        # 将%ds设置为0x10
    movb $0x20, %al
        # 将%al设置为0x20
    outb %al, $0x20
    movl $1, %eax
        # 将%eax置为1
    cmpl %eax, current
        # 将current与%eax进行比较，如果相等则跳转到1去执行
    je 1f
    movl %eax, current
        # 若不相等，证明目前current为0，那么就去跳转到TSS0那里去执行
    ljmp $TSS1_SEL, $0
    jmp 2f
1:    movl $0, current
        #在这里将current设置为0
    ljmp $TSS0_SEL, $0
        # ljmp的意思是跳转到段选择子，段内偏移
        # jmpi的意思是跳转到段内偏移，段选择子
        # 这里的意思是跳转到TSS0那里去执行
2:    popl %eax
    pop %ds
        # 最后无论如何都会pop，完事儿~
    iret
        # 这里才是真的完事儿了~
        # 用一个最可爱的IRET指令标志注释的结束，再见观众朋友们~

/* system call handler */
.align 2
system_interrupt:
# 系统中断
    push %ds
    pushl %edx
    pushl %ecx
    pushl %ebx
    pushl %eax
        # 保存寄存器
    movl $0x10, %edx
    mov %dx, %ds
        # 将%ds置0x10
    call write_char
        # 调用这个write_char函数，我们不去分析write_char是干啥的了，
        # 根据名称可知，是写一个字符
    popl %eax
    popl %ebx
    popl %ecx
    popl %edx
    pop %ds
        # 弹出各个寄存器
    iret
        # 中断返回
# 可见，这个系统中断做的事情就是把当前任务对应的字符打印出来，
# task0打印“A”，task1打印“B”
# 但是一开始我们看到的是task0是一个死循环，task1还没有执行过？
# 似乎……只有时钟中断可以让task1得到执行了！

/*********************************************/
current:.long 0
scr_loc:.long 0

.align 2
lidt_opcode:
    .word 256*8-1        # idt contains 256 entries
    .long idt        # This will be rewrite by code.
lgdt_opcode:
    # 长度16位，在这里，end_gdt标签位置减去gdt标签位置再加1。
    .word (end_gdt-gdt)-1    # so does gdt
    # 基址32位，gdt的基址就叫gdt。好，我们去看看写了什么……
    .long gdt        # This will be rewrite by code.

.align 8
# 这个指令我们汇编课上学过，忘记的去百度一下哦~
idt: .fill 256,8,0 # idt is uninitialized
# fill伪指令：.fill repeat,size,value 本命令生成size个字节的repeat个副本。
# 各个副本中的内容取自一个8字节长的数。最高4个字节为零，最低的4个字节是value，
# 那么这个指令的意思就是复制256个8字节大小的量，每项都填充成为0
# 看完后面那通代码可知，这里的fill指令纯粹就是为了占位置的，嗯对一定是这样。

gdt:    .quad 0x0000000000000000    /* NULL descriptor */
        # 出现了一个我们没有见过的伪指令，但是它的意思跟 .word是一类的，表示定义一个多长的空间
        # quad是多长呢？联想“quadra kill”……肯定跟四什么什么有关，
        # 再看后面串的长度，可见这个四是四个字的意思。.quad就是规定了后面的八个字节（四个字）的数据的伪指令
    .quad 0x00c09a00000007ff    /* 8Mb 0x08, base = 0x00000 */
        # 这个0x00c09a00000007ff是怎么组成的呢？
        # 显然从左到右是从高到低，我们按照每二位16进制数一拆分
        # 0x 00               c09a            00
        #     基地址的31-24位一些状态标识位基地址的23-16位
        #     0000               07ff
        #     基地址的15-0位   段限长，2047个字节
        # 可见这个基地址是0x00000000，与下面这个表项所示一样，说明代码段和数据段是重叠的~
    .quad 0x00c09200000007ff    /* 8Mb 0x10 */
    .quad 0x00c0920b80000002    /* screen 0x18 - for display */
        # 上面一共有四项，gdt第一项还是照例空缺
        # 第四项是显示内存段的描述符，段选择符是0x18……怎么算的就不讲了~
    .word 0x0068, tss0, 0xe900, 0x0    # TSS0 descr 0x20
        # 任务0的TSS段，段选择符0x20
    .word 0x0040, ldt0, 0xe200, 0x0    # LDT0 descr 0x28
        # 任务0的LDT段，段选择符0x28
    .word 0x0068, tss1, 0xe900, 0x0    # TSS1 descr 0x30
        # 任务1的TSS段，段选择符0x30
    .word 0x0040, ldt1, 0xe200, 0x0    # LDT1 descr 0x38
        # 任务1的LDT段，段选择符0x38
end_gdt:
    .fill 128,4,0
        # 哦最后这个是做啥的？
        # 猜~
    # 好的看到这里我们可以回去了，回到call setup_gdt那里！
init_stack:                          # Will be used as user stack for task0.
    .long init_stack
    .word 0x10

/*************************************/
.align 8
ldt0:    .quad 0x0000000000000000
    .quad 0x00c0fa00000003ff    # 0x0f, base = 0x00000
    .quad 0x00c0f200000003ff    # 0x17

tss0:    .long 0             /* back link */
    .long krn_stk0, 0x10        /* esp0, ss0 */
    .long 0, 0, 0, 0, 0        /* esp1, ss1, esp2, ss2, cr3 */
    .long 0, 0, 0, 0, 0        /* eip, eflags, eax, ecx, edx */
    .long 0, 0, 0, 0, 0        /* ebx esp, ebp, esi, edi */
    .long 0, 0, 0, 0, 0, 0         /* es, cs, ss, ds, fs, gs */
    .long LDT0_SEL, 0x8000000    /* ldt, trace bitmap */

.fill 128,4,0
krn_stk0:
# .long 0

/************************************/
.align 8
ldt1:    .quad 0x0000000000000000
    .quad 0x00c0fa00000003ff    # 0x0f, base = 0x00000
    .quad 0x00c0f200000003ff    # 0x17

tss1:    .long 0             /* back link */
    .long krn_stk1, 0x10        /* esp0, ss0 */
    .long 0, 0, 0, 0, 0        /* esp1, ss1, esp2, ss2, cr3 */
    .long task1, 0x200        /* eip, eflags */
    .long 0, 0, 0, 0        /* eax, ecx, edx, ebx */
    .long usr_stk1, 0, 0, 0        /* esp, ebp, esi, edi */
    .long 0x17,0x0f,0x17,0x17,0x17,0x17 /* es, cs, ss, ds, fs, gs */
    .long LDT1_SEL, 0x8000000    /* ldt, trace bitmap */

.fill 128,4,0
krn_stk1:

/************************************/
task0:
    movl $0x17, %eax
    movw %ax, %ds
        # %ds置为0x17,
    movb $65, %al              /* print ‘A‘ */
        # %al置为ASCII码的65号，“A”
    int $0x80
        # 调用int $0x80，这个中断在之前就已经写好了，
        # 我们可以去看看system_interrupt，这个就是0x80中断的处理程序，
        # 为什么？在上面写了，请好好的找一找~
        # 然后我们就去这个处理程序看看去，我们目前知道的是，ds为0x17，al为65
        #？？？
    movl $0xfff, %ecx
        # 将%ecx改为0xfff，意思是一直执行这个task0，因为loop没执行一次会减ecx的值
1:    loop 1b
        # b和f的意思分别是向前跳转和向后跳转的意思
    jmp task0
# 先在我们只看到task0的工作，那么task1何时工作呢？
# 在前面我们记得时钟中断在每10ms时8253芯片会发送一个时钟中断，
# 我们还没有分析这个时钟中断是做什么的。
task1:
    movl $0x17, %eax
    movw %ax, %ds
    movb $66, %al              /* print ‘B‘ */
    int $0x80
    movl $0xfff, %ecx
1:    loop 1b
    jmp task1
    # 不解释……跟task0差不多……
    .fill 128,4,0
usr_stk1:

时间： 2024-11-12 12:18:38

[Operating System Labs] 我对Linux0.00中 head.s 的理解和注释

[Operating System Labs] 我对Linux0.00中 head.s 的理解和注释的相关文章

[Operationg System Labs] 我对 Linux0.00 中 boot.s的理解和注释

vmdk通过v2v转换后operating system not found

VMware vSphere Client中启动虚拟机提示No boot filename received/Operating System not found解决方法

Operating System Engineering

ROS是Robot Operating System

osquery An Operating System Instrumentation Framewor

CREATE FILE encountered operating system error 5(Access is denied.)

《modern operating system》 chapter 3 MEMORY MANAGEMENT 笔记

Linux启动报错missing operating system