Linux-0.11内核源代码分析系列:内存管理get_free_page()函数分析

Linux-0.11内存管理模块是源码中比較难以理解的部分,如今把笔者个人的理解发表

先发Linux-0.11内核内存管理get_free_page()函数分析

有时间再写其它函数或者文件的:)

/*
 *Author  : DavidLin
 *Date    : 2014-11-11pm
 *Email   : [email protected] or [email protected]
 *world   : the city of SZ, in China
 *Ver     : 000.000.001
 *history :     editor      time            do
            1)LinPeng       2014-11-11      created this file!
            2)
 */

下面是Linus的源代码:

/*
 * Get physical address of first (actually last :-) free page, and mark it
 * used. If no free pages left, return 0.
 */
unsigned long get_free_page(void)
{
register unsigned long __res asm("ax");

__asm__("std ; repne ; scasb\n\t"
    "jne 1f\n\t"
    "movb $1,1(%%edi)\n\t"
    "sall $12,%%ecx\n\t"
    "addl %2,%%ecx\n\t"
    "movl %%ecx,%%edx\n\t"
    "movl $1024,%%ecx\n\t"
    "leal 4092(%%edx),%%edi\n\t"
    "rep ; stosl\n\t"
    "movl %%edx,%%eax\n"
    "1:"
    :"=a" (__res)
    :"0" (0),"i" (LOW_MEM),"c" (PAGING_PAGES),
    "D" (mem_map+PAGING_PAGES-1)
    :"di","cx","dx");
return __res;
}

1.函数目的:

寻找mem_map[0..(PAGING_PAGES-1)]中的空暇项。即mem_map[i]==0的项,假设找到。

就返回物理地址,找不到返回0

2.技巧:

这段代码为何用C嵌套汇编实现?

笔者个人觉得C函数会开辟栈帧。可能会污染任务堆栈。

同一时候该函数须要常常频繁的调用,汇编中,寄存器级别的汇编指令操作的效率比C更高:)

3.代码分析:

(1)register unsigned long __res asm("ax");

__res是寄存器级变量,值保存在ax寄存器中,就是说对__res的操作等于ax寄存器的操作,为效率考虑

(2)__asm__("std ; repne ; scasb\n\t"

循环比較。找出mem_map[i]==0的页;

std设置DF=1,所以scasb运行递减操作,涉及寄存器al, ecx, es:(e)di三个寄存器,在函数尾部的定义中

:"0" (0),"i" (LOW_MEM),"c" (PAGING_PAGES),

"D" (mem_map+PAGING_PAGES-1)

:"di","cx","dx");

即有

al       = 0;    //假设mem_map[i] == 0,表示为空暇页,否则为已分配占用,al保存0值,用于比較

ecx    = PAGING_PAGES;                                 //主内存叶表个数

es:di =  (mem_map+PAGING_PAGES-1);   //内存管理数组最后一项

这句指令的意思是从数组mem_map[0..(PAGING_PAGES-1)]的最后一项

mem_map[PAGING_PAGES-1]開始,比較mem_map[i]是否等于0(0值保存在al寄存器中);

每比較一次,es:di值减1,假设不相等,es:di值减1,即mem_map[i--],继续比較,直到ecx == 0;

假设相等,则跳出循环

C语言实现例如以下:

    ......
    index_ = 0;

    for (i = PAGING_PAGES-1; i != 0; i--)
    {
        if(0 != mem_map[i]) {
            continue;   //继续循环
        }
        else {
            index_ = i; //跳出循环
            break;
        }
    }

    if(0 == index_) {
      goto Label_1;
    }

    Label_1:
           return index_;
  ......

(3)"jne 1f\n\t"

假设mem_map[0..(PAGING_PAGES-1)]均不等于0,

跳转到标签1f处运行,Nf表示向前标签,Nb表示向后标签,N是取值1-10的十进制数字

(4)"movb $1,1(%%edi)\n\t"

mem_map[i]==0是mem_map[0..(PAGING_PAGES-1)]中逆序第一个找到的等于0的目标,

将edi的最低位置1。即mem_map[i]=1,标志为该页已被占用,不是空暇位

(5)"sall $12,%%ecx\n\t"

此时ecx保存的是mem_map[i]的下标i,即相对页面数,

举例:

如果mem_map[0..(PAGING_PAGES-1)]最后一个參数

mem_map[PAGING_PAGES-1] == 0。即i == (PAGING_PAGES-1),

所以此时*ecx == PAGING_PAGES-1;

此时相对页面地址是4k*(PAGING_PAGES-1),

每一页1024个4字节物理页,左移12位等于4096(2的12次方),

(6)    "addl %2,%%ecx\n\t"

加上低端内存地址,得到实际物理地址

%2等于LOW_MEM,在例如以下语句中定义

"0" (0),"i" (LOW_MEM),"c" (PAGING_PAGES),

提问:

为什么4k*(PAGING_PAGES-1)不是实际物理地址呢?

答案是初始化的时候例如以下:

mem_map[0..(PAGING_PAGES)]是主内存管理数组

管理的仅仅是1-16M的空间,即PAGING_MEMORY = ((16-1)*1024*1024)

不包含0-1M(0-1M,事实上是0-640K已经被内核占用)

        #define LOW_MEM 0x100000
        #define PAGING_MEMORY (15*1024*1024)
        #define PAGING_PAGES (PAGING_MEMORY>>12)
        #define MAP_NR(addr) (((addr)-LOW_MEM)>>12)
        void mem_init(long start_mem, long end_mem)
        {
            int i;

            HIGH_MEMORY = end_mem;
            for (i=0 ; i<PAGING_PAGES ; i++){
                mem_map[i] = USED;
            }//全部主内存区初始化为被占用
            i = MAP_NR(start_mem);
            end_mem -= start_mem;
            end_mem >>= 12;
            while (end_mem-->0)
            mem_map[i++]=0;
        }

(7)"movl %%ecx,%%edx\n\t"

将ecx寄存器的值保存到edx寄存器中。即将实际物理地址保存到edx寄存器中。

(8)"movl $1024,%%ecx\n\t"

将1024保存到ecx寄存器中,由于每一页占用4096字节(4K),

实际物理内存,每项占用4字节,有1024项。

(9)"leal 4092(%%edx),%%edi\n\t"

由于依照4字节对齐,所以每项占用4字节,

取当前物理页最后一项4096 = 4096-4 = 1023*4 = (1024-1)*4 。

将该物理页面的末端保存在edi寄存器中,

即ecx+4092处的地址保存在edi寄存器中。

(10)"rep ; stosl\n\t"

从ecx+4092处開始,反方向,步进4,反复1024次,

将该物理页1024项所有填入eax寄存器的值。

在例如以下代码定义中,eax初始化为0(al=0,eax =0,ax =0)

:"0" (0),"i" (LOW_MEM),"c" (PAGING_PAGES),

所以该物理页1024项所有清零。

(11)"movl %%edx,%%eax\n"

将该物理页面起始地址放入eax寄存器中。

Intel的EABI规则中,

eax寄存器用于保存函数返回值

(12)"1:"

标签1,用于"jne 1f\n\t"语句跳转返回0值。

注意:

eax寄存器仅仅在"movl %%edx,%%eax\n"中被赋值,

eax寄存器初始值是‘0‘,假设跳转到标签"1:"处,

返回值是0。表示没有空暇物理页。

(13):"=a" (__res)

输出寄存器列表。这里仅仅有一个,当中a表示eax寄存器

(14):"0" (0),"i" (LOW_MEM),"c" (PAGING_PAGES),

"0"表示与上面同个位置的输出同样的寄存器,即"0"等于输出寄存器eax。

即eax既是输出寄存器,同一时候也是输入寄存器,

当然,在时间颗粒度最小的情况小,eax不能同一时候作为输入或者输出寄存器,

仅仅能作为输入或者输出寄存器;

"i" (LOW_MEM)是%2,从输出寄存器到输入寄存器依次编号%0,%1,%2.....%N,

当中"i"表示马上数。不是edi的代号,edi的代号是"D";

"c" (PAGING_PAGES)表示将ecx寄存器存入PAGING_PAGES,

ecx寄存器代号"c"。

(15)"D" (mem_map+PAGING_PAGES-1)

"D"使用edi寄存器,即edi寄存器保存的值是(mem_map+PAGING_PAGES-1)

即%%edi = &mem_map[PAGING_PAGES-1]。

(16):"di","cx","dx");

保留寄存器,告诉编译器"di","cx","dx"三个寄存器已经被分配,

在编译器编译中,不会将这三个寄存器分配为输入或者输出寄存器。

(17)return __res;

返回__res保存的值,

相当于汇编的ret,隐含将eax寄存器返回。

C语言中是显式返回。

4.汇编指令及语法规则解析。參照Intel官方文档《Volume 2A Instruction Set Reference (A-M)》

《Volume 2B Instruction Set Reference (N-Z)》,GNU汇编规则

(1)std:

主要将ESI and/or EDI方向设置为递减。相应cld(用于方向设置为递增)

1)Operation

Sets the DF flag in the EFLAGS register. When the DF flag is set to 1, string operations

decrement the index registers (ESI and/or EDI).

This instruction’s operation is the same in non-64-bit modes and 64-bit mode.

2)Operation

DF -> 1;

(2)repne:

1)Description

Repeats a string instruction the number of times specified in the count register or

until the indicated condition of the ZF flag is no longer met. The REP (repeat), REPE

(repeat while equal), REPNE (repeat while not equal), REPZ (repeat while zero), and

REPNZ (repeat while not zero) mnemonics are prefixes that can be added to one of

the string instructions. The REP prefix can be added to the INS, OUTS, MOVS, LODS,

and STOS instructions, and the REPE, REPNE, REPZ, and REPNZ prefixes can be

added to the CMPS and SCAS instructions. (The REPZ and REPNZ prefixes are synonymous

forms of the REPE and REPNE prefixes, respectively.) The behavior of the REP

prefix is undefined when used with non-string instructions.

The REP prefixes apply only to one string instruction at a time. To repeat a block of

instructions, use the LOOP instruction or another looping construct. All of these

repeat prefixes cause the associated instruction to be repeated until the count in

register is decremented to 0. See Table 4-13.

2)Operation

    IF AddressSize = 16
        THEN
            Use CX for CountReg;
        ELSE IF AddressSize = 64 and REX.W used
            THEN Use RCX for CountReg; FI;
        ELSE
            Use ECX for CountReg;
    FI;
    WHILE CountReg = 0
        DO
            Service pending interrupts (if any);
            Execute associated string instruction;
            CountReg <- (CountReg – 1);
            IF CountReg = 0
            THEN exit WHILE loop; FI;
            IF (Repeat prefix is REPZ or REPE) and (ZF = 0)
            or (Repeat prefix is REPNZ or REPNE) and (ZF = 1)
            THEN exit WHILE loop; FI;
        OD;

(3)scasb:

GNU汇编

在汇编语言中SCASB是一条字符串操作指令,源自“SCAN String Byte”的缩写。该指令的详细操作是 :

    ---------------------------------------------------------------------------------------
    Code    |    Mnemonic |    Description
    ---------------------------------------------------------------------------------------
    AE      |   SCAS m8   |    Compare AL with byte at ES:(E)DI and set status flags
    ---------------------------------------------------------------------------------------
    AF      |   SCAS m16  |    Compare AX with word at ES:(E)DI and set status flags
    ---------------------------------------------------------------------------------------
    AF      |   SCAS m32  |    Compare EAX with doubleword at ES(E)DI and set status flags
    ---------------------------------------------------------------------------------------
    AE      |   SCASB     |    Compare AL with byte at ES:(E)DI and set status flags
    ---------------------------------------------------------------------------------------
    AF      |   SCASW     |    Compare AX with word at ES:(E)DI and set status flags
    ---------------------------------------------------------------------------------------
    AF      |   SCASD     |    Compare EAX with doubleword at ES:(E)DI and set status flags
    ---------------------------------------------------------------------------------------

计算 AL - byte of [ES:EDI] , 设置对应的标志寄存器的值。

改动寄存器EDI的值:假设标志DF为0,则 inc EDI;假设DF为1。则 dec EDI。

SCASB指令常与循环指令REPZ/REPNZ合用。

比如。REPNZ SCASB 语句表示当 寄存器ECX>0 且 标志寄存器ZF=0,则再运行一次SCASB指令。

比較寄存器AL的值不相等则反复查找的字

(4)sall

如sall $12, %ecx.

这个指令是算法左移,相当于c语言中的左移操作符<<.

intel汇编指令中的SAL,(Shit Arithmetic left).

依据AT&T的语法规则,

由于是一个长型的操作(ecx),

所以在intel汇编指令sal上加一个"l",

即转换成sall。

(5)stosl

STOSL指令相当于将EAX中的值保存到ES:EDI指向的地址中,

若设置了EFLAGS中的方向位置位(即在STOSL指令前使用STD指令)

则EDI自减4。否则(使用CLD指令)EDI自增4。

(6)eax,ax,ah,al

        00000000 00000000 00000000 00000000
        |===============EAX===============|--32个0,4个字节,2个字,1个双字
                          |======AX=======|--16个0,2个字节,1个字
                          |==AH===|-----------8个0,1个字节
                                  |===AL==|---8个0,1个字节

EAX是32位的寄器,仅仅是在原有的8086CPU的寄存器AX上添加了一倍的数据位数。

故而EAX与AX根本不可能独立,二者是总体与部分的关系。

对EAX直接赋值,若更改了低16位自然会改变了AX值,

而AX又能够影响EAX总体。而AH,AL寄存器和AX之间的关系也是如此。

转载请注明出处,谢谢:-)

林鹏!加油。向李云和陈皓看齐。

MyBlog   : http://blog.csdn.net/linpeng12358

MyMail   : [email protected] or [email protected]

MyGithub : DavilLin1577

welcome everybody!

:-)

时间: 2024-12-22 22:21:19

Linux-0.11内核源代码分析系列:内存管理get_free_page()函数分析的相关文章

Linux-0.11内核内存管理get_free_page()函数分析

/* *Author : DavidLin*Date : 2014-11-11pm*Email : [email protected] or [email protected]*world : the city of SZ, in China*Ver : 000.000.001*history : editor time do 1)LinPeng 2014-11-11 created this file! 2)*/Linux-0.11内存管理模块是源代码中比较难以理解的部分,现在把笔者个人的理解

Linux 0.12和Linux 0.11内核学习——Google邮件列表

亲,你在学习Linux 0.12或0.11内核吗?快来加入我们吧,就缺你了!!! 为什么选用邮件列表呢?因为赵炯博士那个论坛交流不是很方便,经常发了贴没人回,人气相比十年前论坛刚成立时弱了不少.很多人,很多元老级别的人物,消失了...再也没有出现过. 而QQ群很繁杂,比如你肯定会因为一些兴趣爱好加入一些QQ群,但是也就刚加进去或者自己有什么要问的时候说几句,之后就屏蔽了,因为每天都有人在聊天,什么内容都有,想退群却又怕以后有用,不退吧又很烦,只能屏蔽了潜水. 而邮件列表,你可以订阅主题,实时追踪

Linux0.11内核源码分析系列:内存管理copy_page_tables()函数分析

/*   *Author  : DavidLin   *Date    : 2014-11-22pm   *Email   : [email protected] or [email protected]   *world   : the city of SZ, in China   *Ver     : 000.000.001   *history :     editor      time            do   *          1)LinPeng       2014-11

Linux-0.11内核源码分析系列:内存管理copy_page_tables()函数分析

/* *Author : DavidLin *Date : 2014-11-22pm *Email : [email protected] or [email protected] *world : the city of SZ, in China *Ver : 000.000.001 *history : editor time do * 1)LinPeng 2014-11-22 created this file! * 2) */ /* * Well, here is one of the

Linux 0.11 内核学习之main.c

1.之所以选择这么低的版本学习,答案是简单,高版本的代码量太大,对于我这样的初学者来说,就是瞎子摸象不会有什么感觉.开始吧! 2首先你需要在一个地方下载源码:OldLinux 3.分析: 1 /* 2 * linux/init/main.c 3 * 4 * (C) 1991 Linus Torvalds 5 */ 6 7 #define __LIBRARY__ //在unistd.h中,使用了#ifndef __LIBRARY__ 8 #include <unistd.h> //包含units

Linux-0.11内核源码分析系列:进程调度sleep_on()函数分析

</pre><pre name="code" class="cpp">/* *Author : DavidLin *Date : 2014-12-10pm *Email : [email protected] or [email protected] *world : the city of SZ, in China *Ver : 000.000.001 *history : editor time do * 1)LinPeng 2014-1

Linux 0.11 中字符设备的使用

Linux 0.11 字符设备的使用 一.概述 本文自顶向下一步步探索字符设备的读写是怎么完成的.通常我们在Linux应用程序中用open.read.write对各种类型的文件进行操作.我们可以从键盘输入,然后命令行窗口会显示你的输入,有输出的话则命令行窗口会显示输出.为什么所有的设备在Linux中都被看成是一个个文件,可以通过统一的read.write直接进行读写?文件句柄与终端设备有什么关联?为什么Linux允许多个控制终端登录?tty又是什么东西?读写时将发生哪些硬件中断,驱动程序是怎么回

Linux 0.11下信号量的实现和应用

Linux 011下信号量的实现和应用 生产者-消费者问题 实现信号量 信号量的代码实现 关于sem_wait和sem_post sem_wait和sem_post函数的代码实现 信号量的完整代码 实现信号量的系统调用 测试用的应用程序的实现 Linux 0.11下信号量的实现和应用 1.生产者-消费者问题 从一个实际的问题:生产者与消费者出发,谈一谈为什么要有信号量?信号量用来做什么? 问题描述:现在存在一个文件”.\buffer.txt”作为一个共享缓冲区,缓冲区同时最多只能保存10个数.现

Linux 0.11中write实现

看了一下Linux 0.11版本write的实现,首先它在标准头文件unistd.h中有定义 int write(int fildes, const char * buf, off_t count); 接下来看write.c /* * linux/lib/write.c * * (C) 1991 Linus Torvalds */ #define __LIBRARY__ #include <unistd.h> //定义write的实现 _syscall3(int,write,int,fd,co