《Linux内核分析与实现》 第四周 读书笔记

第五章 系统调用

20135307 张嘉琪


5.1 与内核通信

  • 系统调用在用户空间进程和硬件设备之间添加了一个中间层,该层主要作用有三个:

    1. 它为用户空间提供了一种硬件的抽象接口
    2. 系统调用保证了系统的稳定和安全,作为硬件设备和应用程序之间的中间人,内核可以基于权限、用户类型和其他一些规则对需要进行的访问进行裁决
    3. 在第3章中曾经提到过,每个进程都运行在虚拟系统中,而在用户空间和系统的其余部分提供这样一层公共接口,也是出于这种考虑,如果应用程序可以随意访问硬件而内核又对此一无所知的话几乎就没法实现多任务和虚拟内存,当然也不可能实现良好的稳定性和安全性。
  • 在Linux中,系统调用是用户空间访问。内核的唯一手段;除异常和陷入外,它们是内核唯一的合法入口。
  • 本章重点强调Linux系统调用的规则和实现方法。

5.2 API、POSIX和C库

  • 一般情况下,应用程序通过在用户空间实现的应用编程接口而不是直接通过系统调用来编程。应用程序使用的这种编程接口实际上并不需要和内核提供的系统调用对应。一个API定义了一组应用程序使用的编程接口,它们可以实现成一个系统调用,也可以通过调用多个系统调用来实现,而完全不使用任何系统调用也不存在问题。实际上,API可以在各种不同的操作系统实现,给应用程序提供完全相同的接口,而它们本身在这些系统上的实现却可能迥异。API、POSIX和C库以及系统调用之间的关系如图5-1

5.3 系统调用

  • 要访问系统调用(在Linux中常称作syscall),通常通过C库中定义的函数调用来进行。

5.3.1 系统调用号

  • 在Linux中,每个系统调用被赋予一个系统调用号。这样,通过这个独一无二的号就可以关联系统调用。当用户空间的进程执行一个系统调用的时候,这个系统调用号就用来指明到底是要执行哪个系统调用。
  • 系统调用号一旦分配就不能再有任何变更,否则编译好的应用程序就会崩溃。此外,如果一个系统调用被删除,它所占用的系统调用号也不允许被回收利用,否则,以前编译过的代码会调用这个系统调用,但事实上却调用的是另一个系统调用。
  • 内核记录了系统调用表中的所有已注册过的系统调用的列表,存储在syscalltable中。
  • 每一种体系结构中,都明确定义了这个表,在×86-64中,它定义于arch/i386/kernel/syscall_64.c文件中。这个表为每一个有效的系统调用指定了唯一的系统调用号。

5.3.2 系统调用的性能

  • Linux系统执行快的原因:

    1. 很短的上下文切换时间。
    2. 系统调用处理程序和每个系统调用本身也十分简洁。

5.4 系统调用处理程序

  • 用户空间的程序无法执行内核代码。

5.4.1 指定恰当的系统调用

  • 必须把系统调用号一并传给内核。
  • 在x86上,系统调用号是通过eax寄存器传递给内核的。

5.4.2 参数传递

  • 除了系统调用号外,大部分系统调用都还需要一些外部的参数输入。
  • 最简单的办法是像传递系统调用号一样,把这些参数也放在寄存器里。

5.5 系统调用的实现

5.5.1 实现系统调用

5.5.2 参数验证

  • 系统调用必须仔细检查它们所有的参数是否合法有效。系统调用在内核空间执行,如果任由用户将不合法的输入传递给内核,那么系统的安全和稳定将面临极大的考验;
  • 最重要的一种检查就是检查用户提供的指针是否有效。试
  • 在接收一个用户空间的指针之前,内核必须保证:
    1. 指针指向的内存区域属于用户空间,进程决不能哄骗内核去读内核空间的数据。
    2. 指针指向的内存区域在进程的地址空间里,进程决不能哄骗内核去读其他进程的数据。
    3. 如果是读,该内存应被标记为可读;如果是写,该内存应被标记为可写;如果是可执行,该内存被标记为可执行。进程绝不能绕过内存访问权限。

5.6 系统调用上下文

  • 内核在执行系统调用的时候处于进程上下文。在进程上下文中,内核可以休眠并且可以被抢占。
  • 当系统调用返回的时候,控制权仍在system_call()中,它最终会负责切换到用户空间,并让用户进程继续执行下去。

5.6.1 绑定一个系统调用的最后步骤

  • 当编写完一个系统调用后,把它注册成一个正式的系统调用是件琐碎的工作:

    1. 首先,在系统调用表的最后加入一个表项。每种支持该系统调用的硬件体系都必须做这样的工作(大部分的系统调用都针对所有的体系结构)从0开始算起,系统调用在该表中的位置就是它的系统调用号。如第10个系统调用分配到的系统调用号为9)
    2. 对于所支持的各种体系结构,系统调用号都必须定义于<asm/unistd.h>中。
    3. 系统调用必须被编译进内核映象(不能被编译成模块)。这只要把它放进kernel/下的一个相关文件中就可以了,比如sys.c,它包含了各种各样的系统调用。

5.6.2 从用户空间访问系统调用

5.6.3 为什么不通过系统调用的方式实现

  • 建立一个新的系统调用的好处

    • 系统调用创建容易且使用方便。
    • Linux系统调用的高性能显而易见。
  • 建立一个新的系统调用的问题
    • 你需要―个系统调用号,而这需要一个内核在处于开发版本的时候由官方分配给你。
    • 系统调用被加入稳定内核后就被固化了,为了避免应用程序的崩溃,它的接口不允许做改动
    • 需要将系统调用分别注册到每个需要支持的体系结构中去。
    • 在脚本中不容易调用系统调用,也不能从文件系统直接访问系统调用。
    • 由于你需要系统调用号,因此在主内核树之外是很难维护和使用系统调用的。
    • 如果仅仅进行简单的信息交换系统调用就大材小用了。
  • 替代方法

    实现一个设备节点,并对此实现read()和write()。使用特定的信息进行检索。

    • 像信号量这样的某些接口,可以用文件描述符来表示,因此也就可以按上述方式对其进行操作
    • 把增加的信息作为一个文件放在sysfs的合适位置。

5.7 小结

在本章,我们描述了系统调用到底是什么,它们与库函数和应用程序接口有怎样的关系。

然后,我们考察了Linux内核如何实现系统调用,以及以及执行系统调用的连锁反应:陷入内核,传递系统调用号和参数,执行正确的系统调用函数,并把返回值带回用户空间。 然后,我们讨论了如何增加系统调用,并提供了从用户空间调用系统调用的简单例子。整个过程相当容易!增加一个新的系统调用没有什么难的,这一过程也就是系统调用的实现过程。书的其余部分讨论了编写规范的、最优化的、安全的系统调用所遵循的概念和内核接口规范。

最后,通过讨论实现系统调用的优缺点以及列举其替代方案的形式对全章内容进行了总结。

时间: 2024-10-08 02:46:01

《Linux内核分析与实现》 第四周 读书笔记的相关文章

《Linux内核分析》第六周学习笔记

<Linux内核分析>第六周学习笔记 进程的描述和创建 郭垚 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 [学习视频时间:1小时 撰写博客时间:2小时] [学习内容:进程创建的过程.使用gdb跟踪分析内核处理函数sys_clone] 一.进程的描述 1.1 进程描述符task_struct数据结构(一) 1. 进程控制块PCB——task_struct 为了管理进程,内核

《Linux内核设计与实现》 Chapter4 读书笔记

<Linux内核设计与实现> Chapter4 读书笔记 调度程序负责决定将哪个进程投入运行,何时运行以及运行多长时间,进程调度程序可看做在可运行态进程之间分配有限的处理器时间资源的内核子系统. 一.多任务 多任务操作系统就是能同时并发地交互执行多个进程的操作系统. 多任务系统可以划分为两类: 非抢占式多任务 进程会一直执行直到自己主动停止运行 抢占式多任务 Linux/Unix使用的是抢占式的方式:强制的挂起进程的动作就叫做抢占. 像所有unix的变体和许多其他现代操作系统一样,Linux提

《Linux内核分析》第七周学习笔记

<Linux内核分析>第七周学习笔记 可执行程序的装载 郭垚 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 [学习视频时间:1小时35分钟 实验时间:1小时 撰写博客时间:2小时] [学习内容:共享库和动态链接.exec系统调用的执行过程.可执行程序的装载] 一.预处理.编译.链接和目标文件的格式 1.1 可执行程序如何得来?

LINUX内核分析第四周学习总结——扒开应用系统的三层皮(上)

LINUX内核分析第四周学习总结——扒开应用系统的三层皮(上) 张忻(原创作品转载请注明出处) <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.知识概要 (一)用户态.内核态和中断处理过程 (二)系统调用概述 系统调用概述和系统调用的三层皮 (三)使用库函数API和C代码中嵌入汇编代码触发同一个系统调用 使用库函数API获取系统当前时间 C代码中嵌入汇编代码的方法(复习) 使用C代码中嵌入汇编代码触发系统调

20135327郭皓--Linux内核分析第四周 扒开系统调用的三层皮(上)

Linux内核分析第四周 扒开系统调用的三层皮(上) 郭皓 原创作品转载请注明出处 <Linux内核分析>MOOC课程 http://mooc.study.163.com/course/USTC-1000029000 一.用户态.内核态和中断 用户态:当进程在执行用户自己的代码时,则称其处于用户态,即此时处理器在特权级最低的(3级)用户代码中运行. 内核态:当一个进程执行系统调用而陷入内核代码中执行时,我们就称进程处于内核态,此时处理器处于特权级最高的(0级)内核代码中执行. PS:CPU指令

《Linux内核分析》第四周学习总结

<Linux内核分析>第四周学习总结                         ——扒开系统调用的三层皮 姓名:王玮怡  学号:20135116 理论总结部分: 第一节 用户态.内核态和中断 一.用户态.内核态和中断处理过程 一般现代CPU都有几种不同的指令执行级别 1.用户态 在相应的低级执行状态下,代码的掌控范围会受到限制,此时为用户态. 2.内核态 在高执行级别下,代码可以执行特权指令,访问任意的物理地址,这种CPU执行级别就对应着内核态. 3.举例 Intel x86 CPU有四

Linux内核分析第四章 读书笔记

Linux内核分析第四章 读书笔记 第一部分--进程调度 进程调度:操作系统规定下的进程选取模式 面临问题:多任务选择问题 多任务操作系统就是能同时并发地交互执行多个进程的操作系统,在单处理器机器上这会产生多个进程在同时运行的幻觉,在多处理器机器上,这会使多个进程在不同的处理机上真正同时.并行地运行.无论在单处理器或者多处理器机器上,多任务操作系统都能使多个进程处于堵塞或者睡眠状态,也就是说,实际上不被投入执行,直到工作确实就绪. 多任务系统可以划分为两类:非抢占式多任务和抢占式多任务.Linu

20135201李辰希 《Linux内核分析》第四周 扒开系统调用的“三层皮”

李辰希无转载 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 一.用户态.内核态和中断处理过程 1.我们与系统调用打交道是通过库函数的方式 2.一般现代CPU都有几种不同的指令执行级别 因为如果所有程序员写的代码都可以有特权指令的话,系统就会很容易崩溃. 3.区别: 在高级别的状态下,代码可以执行特权指令,访问任意的物理地址. 在相应的低级别执行状态下,代码的掌控范围会受到限制. Intel x86 CPU有四

《Linux内核分析》第四周 扒开系统调用的“三层皮”

[刘蔚然 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000] WEEK FOUR(3.14——3.20)扒开系统调用的“三层皮” SECTION 1 用户态.内核态和中断处理过程 1.用户态.内核态区别 在高级别的状态下,代码可以执行特权指令,访问任意的物理地址: 在相应的低级别执行状态下,代码的掌控范围会受到限制. 为什么会有这种级别划分? 没有访问权限划分容易使得系统混乱(毕竟普通程序

Linux内核分析第四周作业

使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用 首先从系统调用表中选择一个系统调用,我选择了122号系统调用--uname 122 i386 uname sys_newuname 先用man查一下api是怎么使用的 man 2 api 这里的2表示查询系统调用uname(2),否则默认查的是uname(1),也就是在shell中运行的uname程序. 可以看到,要使用uname,首先要include头文件sys/utsname.h.然后定义一个utsname结构体的变量,将这个