2017-2018-1 20179209《Linux内核原理与分析》第八周作业

Linux内核如何装载和启动一个可执行程

一.实验

1.1理解编译链接的过程和ELF可执行文件格式。

1.1.1编译链接过程

能用图说明的问题,就少用文字描述:

1.1.2ELF可执行文件

ELF可执行文件中有三种主要的目标文件:

  • 一个可重定位文件保存着代码和适当的数据,用来和其他的object文件一起创建一个可执行文件或者是一个共享文件。主要是.o文件
  • 一个可执行文件保存着一个用来执行的程勋;该文件指出了exec如何创建程序进程映像。
  • 一个共享object文件保存着代码和合适地数据,用来被下面的两个链接器链接。第一个是链接编辑器,可以和其他的可重定位的共享object文件来创建其他的object。第二个是动态链接器,联合一个可执行文件和其他的共享object文件来创建一个进程映像。

    Object文件参与程序的链接(创建一个程序)和程序的执行(运行一个程序)。一个ELF头在文件的开始,保存了路线图(road map),描述该文件的组织情况。程序头表告诉系统如何创建一个进程的内存映像。section头表包含了描述文件sections的信息。每个section在这个表中有一个入口;每个入口给出了该section的名字、大小等信息。[email protected]:~/homework$ readelf -h mainc查看一个main目标文件的信息:

1.2编程使用exec*库函数加载一个可执行文件,动态链接分为可执行程序装载时动态链接和运行时动态链接,编程练习动态链接库的这两种使用方式。

1.2.1使用execlp加载上周GCC内联汇编的main程序

关于execlp函数的介绍

int main(int argc,char *argv[]){
        int pid;
        pid = fork();
        if(pid < 0){
                fprintf(stderr,"Fork failed!");
                exit(-1);
        }
        else{
                execlp("/home/sillysen/homework/11.14/main","./main","2","0","1","7","9","2","0","9",NULL);
                exit(0);
        }
        return 0;
}

运行结果如下:

execlp函数的第一个参数是可执行程序的路径,后面的参数是这个可执行程序运行时的参数,值得注意的是命令本身也算一个参数,所以第二个参数一般就是命令本身。至于这里为什么输出两遍,而且是这样的格式,我也不太清楚,欢迎大家指正。

1.2.2编程练习动态链接库的这两种使用方式

1.2.2.1可执行程序装载时动态链接

我们测试的代码非常简单,能说明问题就行。把sharelib.c制作成动态库,然后在main函数中调用。源代码如下:

/*
    main 函数
*/
#include <stdio.h>
extern int print();
int main(int argc, char *argv[]){
        print();
        return 0;
}
/*
    sharelib
*/
int print(){
        printf("This is share lib!\n");
        return 0;
}
[email protected]:~/homework/11.16$ gcc -fPIC -shared -o libsharelib.so sharelib.c    //制作动态库libsharelib.so
[email protected]:~/homework/11.16$ sudo cp libsharelib.so /usr/lib    //将生成的动态库拷贝到/usr/lib目录,只有这样生成的程序才能执行

1.2.2.2可执行程序运行时动态链接

修改main函数为如下:

#include <stdio.h>
#include <stdlib.h>
#include <dlfcn.h>
int main(int argc, char *argv[]){
        //print();
        void * handle = dlopen("libsharelib.so",RTLD_NOW);
        if(handle == NULL){
                printf("Open Lib libsharelib.so Error:%s\n",dlerror);
                return -1;
        }
        int (*func)(void);
        char * error;
        func = dlsym(handle,"print");
        if((error = dlerror()) != NULL){
                printf("print not found:%s\n",error);
                return -1;
        }
        func();
        dlclose(handle);
        return 0;
}

编译命令为[email protected]:~/homework/11.16$ gcc -o main main.c -ldl,使用dl系列函数除了要在头文件中包含dlfcn.h之外,在编译链接时还得加-ldl参数。

1.3使用gdb跟踪分析一个execve系统调用内核处理函数sys_execve

根据孟老师视频中讲解的execve系统调用的整个过程,可以把其中一些重要的函数摘录出来,画出如下的一个简易的流程图(不完整的流程图,只包含老师讲解过的过程)如下:

为此我在关键位置设置断点(除了视频中讲解的三个外,又加了其他几个):

开始GDB跟踪:

分析

  • 八个断点只跟踪到了四个exec命令就执行完了。其中第一个是sys_execve,截图中没有是因为我一开始就断在了sys_execve处,第二个是do_open_exec断点,第三个是load_elf_binary,第四个是start_thread。其中do_execve这个断点没出现是因为在sys_execve函数中最后return do_execve(getname(filename),argv,envp);时候我没有s进去看;而load_elf_interp断点没有出现是因为这里调用的fork为静态装载可执行程序,而只有动态装载才会调用这个函数,到此还有两个断点do_execve_common和exec_binprm没有出现。为此我还特意断了一下exec_binprm中search_binary_handler函数,gdb显示没有这个符号,这里就留下一个问题,为什么会出现这样的情况?根据视频中讲解这个函数的目的是装载bprm数据结构,但gdb跟踪过程中却没有这一步。。。
  • 新的可执行程序的起点根据程序的链接方式不同而不同,如果是静态链接,则起点为可执行文件里边规定的entry地址,也是main函数对应的位置;如果是动态链接,则elf_entry就是指向动态链接器的起点。
  • execve返回后之所以能顺利执行是因为可执行程序在当前进程调用execve内核函数的时候已经部署就绪,返回用户态后之前的进程“苏醒”,开始执行程序。

二.第十三、十四章

2.1虚拟文件系统(VFS)

虚拟文件系统,作为内核子系统,为用户程序提供了文件和文件系统相关的接口。系统中所有文件系统不但依赖VFS共存,而且也依靠VFS系统协同工作。通过虚拟文件系统,程序可以利用标准的Uinx系统调用对不同文件系统,甚至不同介质上的文件系统进行读写操作。总而言之,linux下一切皆文件!

2.2文件系统抽象层

之所以可以使用这种通用接口对所有类型的文件系统进行操作,是因为内核在它的底层文件系统接口上建立了一个抽象层。该抽象层使Linux能够支持各种文件系统,即便是它们在功能和行为上存在很大的差别,为了支持多文件系统,VFS提供了一个通用文件系统模型,该模型囊括了任何文件系统的常用功能集和行为。Linux可以支持很多种差异很大的文件系统,从DOS系统的FAT到Windows系统的NTFS,再到各种Unix风格文件系统和Linux特有的文件系统。VFS抽象层之所以能衔接各种各样的文件系统,是因为它定义了所有文件系统都支持的、基本的、概念上的接口和数据结构。同时实际文件系统也将自身的诸如“如何打开文件”,“目录是什么”等概念在形式上与VFS的定义保持一致。因为实际文件系统的代码在同一接口和数据结构下隐藏了具体的实现细节,所以在VFS层和内核的其他部分看来,所有文件系统都是相同的。

2.3VFS中的四个主要对象类型

  • 超级块对象 super_operations
  • 索引节点对象 inode_operations
  • 目录项对象 dentry_opreations
  • 文件对象 file_operations

2.4块设备与字符设备

  • 系统中能够随机访问固定大小数据片的硬件设备称作块设备,这些固定大小的数据片称作块。最常见的块设备是硬盘、软盘驱动器、蓝光光驱和闪存等。它们是以安装文件系统的方式使用的——这也是块设备一般的访问方式。
  • 字符设备按照字符流的方式被有序访问,像串口和键盘就属于字符设备,。如果一个硬件设备是以字符流的方式被访问的话,那就应该将它归为字符设备;如果一个设备是随机访问的,那么它就属于块设备。

    以上两种类型的设备区别在于是否随机访问数据——换句话说,就是能否在访问设备时随机地从一个位置跳转到另一位置。

2.5块设备

块设备中最小的可寻址单元是扇区。扇区大小一般是2的整数倍,最常见的是512字节。扇区的大小是设备的物理属性,扇区是所有块设备的基本单元——块设备无法对比它还小的单元进行寻址和操作,尽管许多块设备能够一次对多个扇区进行操作。

2.6缓冲区和缓冲区头

当一个块被调入内存时(也就是在读入后或等待写出时),它要存储在一个缓冲区中。每个缓冲区与一个块对应,它相当于是磁盘块在内存中的表示。由于内核在处理数据是需要一些相关的控制信息,所以每一个缓冲区都有一个对应的描述符。该描述符用buffer_head结构体表示,称作缓冲区头,在文件<linux/buffer_head.h>中定义,它包含了内核操作缓冲区所需要的全部信息。缓冲区头结构和各个域的说明:

struct buffer_head{
    unsigned long b_state;    //缓冲区状态标志
    struct buffer_head *b_this_page;    //页面中的缓冲区
    struct page *b_page;    //存储缓冲区的页面
    sector_t b_blocknr;    //起始块号
    size_t b_size;    //映像的大小
    char *b_data;    //页面内的数据指针
            .
            .
            .
}
时间: 2024-10-12 03:13:33

2017-2018-1 20179209《Linux内核原理与分析》第八周作业的相关文章

20169217《Linux内核原理与分析》第二周作业

通过第二周的学习,我想把我的博客分为两部分,第一部分是实验楼linux内核分析实验一的实验报告,第二部分是看书第1,2,18章的内容和时间情况. 现在先说实验一 实验内容:将一段c语言程序反汇编成汇编程序. c语言程序代码:应实验要求我把其中部分数值进行了修改. int g(int x) { return x+6; } int f(int x) { return g(x); } int main(void) { return f(9)+3; } 实验过程: 首先创建一个main.c文件 将刚刚修

2017-2018-1 20179202《Linux内核原理与分析》第九周作业

进程的切换和系统的一般执行过程 1.知识总结 (1)进程调度的时机: 中断处理过程直接调用schedule(),或者返回用户态时根据need_resched标记调用schedule(). 内核线程是一个特殊的进程,只有内核态没有用户态,可以直接调用schedule()进行进程切换,也可以在中断处理过程中进行调度(内核线程可以直接访问内核函数,所以不会发生系统调用).内核线程作为一类的特殊的进程可以主动调度,也可以被动调度. 用户态进程无法实现主动调度,仅能在中断处理过程中进行调度(schedul

2017-2018-1 20179203 《Linux内核原理与分析》第九周作业

攥写人:李鹏举 学号:20179203 ( 原创作品转载请注明出处) ( 学习课程:<Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ) 一.实验要求: 1.理解Linux系统中进程调度的时机,可以在内核代码中搜索schedule()函数,看都是哪里调用了schedule(),判断我们课程内容中的总结是否准确: 2.使用gdb跟踪分析一个schedule()函数 ,验证您对Linux系统进程调度与进程切换过程的理

20169203《Linux内核原理与分析》第二周作业

通过本周的学习,我更加具体的了解了计算机的工作原理,对于冯诺依曼体系结构主要为: (1)采用存储程序方式,指令和数据不加区别混合存储在同一个存储器中,(数据和程序在内存中是没有区别的,它们都是内存中的数据,当EIP指针指向哪 CPU就加载那段内存中的数据,如果是不正确的指令格式,CPU就会发生错误中断. 在现在CPU的保护模式中,每个内存段都有其描述符,这个描述符记录着这个内存段的访问权限(可读,可写,可执行).这就变相的指定了哪些内存中存储的是指令哪些是数据)指令和数据都可以送到运算器进行运算

2017-2018-1 20179219《Linux内核原理与分析》第九周作业

一.学习笔记: 1.中断处理过程:包括时钟中断.I/O中断.系统调用和异常.直接调用schedule()函数,在队列中找到进程并分配CPU或返回用户态时根据need_resched标记调用schedule(). 2. 内核线程只有内核态没有用户态,可以直接调用schedule()进行进程之间的切换,也可以在中断处理过程中进行调度.用户态进程无法实现主动调度只能在中断处理过程中调度. 3.内核级别:ring0-3 4.进程上下文包含了进程执行所需要的信息 用户地址空间:包括程序代码,数据,用户堆栈

2017-2018-1 20179205《Linux内核原理与设计》第九周作业

<Linux内核原理与设计>第九周作业 视频学习及代码分析 一.进程调度时机与进程的切换 不同类型的进程有不同的调度需求,第一种分类:I/O-bound 会频繁的进程I/O,通常会花费很多时间等待I/O操作的完成:CPU-bound 是计算密集型,需要大量的CPU时间进行运算,使得其他交互式进程反应迟钝,因此需要不同的算法来使系统的运行更高效,以及CPU的资源最大限度的得到使用.第二种分类包括批处理进程(batch process):实时进程(real-time process)以及交互式进程

20169203《Linux内核原理与分析》第四周作业

通过本周对Linux的学习,我对Linux的进程管理有了更加深入的了解大体来讲进程有五种状态,在五状态进程模型中,进程状态被分成下列五种状态.进程在运行过程中主要是在就绪.运行和阻塞三种状态间进行转换.创建状态和退出状态描述进程创建的过程和进程退出的过程. 1)运行状态(Running):进程占用处理器资源:处于此状态的进程的数目小于等于处理器的数目.在没有其他进程可以执行时(如所有进程都在阻塞状态),通常会自动执行系统的空闲进程. 2)就绪状态(Ready):进程已获得除处理器外的所需资源,等

《Linux内核原理与分析》教学进程

目录 2019-2020-1 <Linux内核原理与分析>教学进程 考核方案 第一周: 第二周: 第三周: 第四周: 第五周 第六周 第七周: 第八周 第九周 第十周 第十一周: 第十二周 第十三周 2019-2020-1 <Linux内核原理与分析>教学进程 考核方案 采取过程化考核,平时成绩占100分,成绩计算:30+30+15+25=100: 翻转课堂基础考核10次: 3*10 = 30 每次考试20-30道题目,考试成绩规格化成3分(比如总分30分就除以10) 翻转课堂测试

20169217 《Linux内核原理与分析》 课程总结

博客链接: 第一周作业 摘要:学习了实验楼linux基础入门课程. 第二周作业 摘要:实验楼实验一:反汇编一个简单的程序.书<linux内核设计与实现>:第1章,第2章,第18章内容. 第三周作业 摘要:自己对于为何要学习linux的感想. 第四周作业 摘要:实验二:分析精简内核源代码mymain.c和myinterrupt.c 书上第2章和第5章内容. 第五周作业 摘要:使用gdb跟踪调试内核从start_kernel到init进程启动 书上第4章和第6章内容. 第六周作业 摘要:使用库函数