20135239 益西拉姆 linux内核分析 读书笔记之第四章

chapter 4 进程调度

4.1 多任务

  • 多任务操作系统就是能同时并发的交互执行多个进程的操作系统。
  • 多任务系统可以划分为两类:
     - 非抢占式多任务:
            - 进程会一直执行直到自己主动停止运行(这一步骤称为让步)
     - 抢占式多任务:
          - Linux/Unix使用的是抢占式的方式;强制的挂起进程的动作就叫做抢占。进程在被抢占之前能够运行的时间是预先设置好的(也就是进程的时间片)
    

4.2 linux的进程调度

  1. O(1)调度器:对大服务器的工作负载很理想,但是缺少交互进程。
  2. 反转楼梯最后期限调度算法(RSDL)
  3. 完全公平调度算法(CFS)

4.3 策略

  • 策略决定调度程序在合适让什么程序运行。

4.3.1 进程分类

  • I/O消耗型

    • 进程的大部分时间用来提交I/O请求或者等待I/O请求,经常处于可运行状态但是运行时间很短,等待更多的请求时最后总会阻塞。
  • 处理器消耗型
    • 把时间大多用在执行代码上,除非被抢占,否则通常都会不停运行。
  • 调度策略通常要在两个矛盾的目标中间寻找平衡:
    • 进程调度迅速(响应时间短)
    • 最大系统利用率(高吞吐量)
  • Linux倾向于优先调度I/O消耗型进程

4.3.2 进程优先级

  • 调度算法中最基本的一类就是基于优先级的调度:

    • 优先极高的进程先运行;相同优先级的进程按照轮转方式进行调度
  • 调度程序总是选择时间片未用尽而且优先级最高的进程运行。
  • Linux采用了两种不同的优先级范围:
    • nice值(从-20——+19):默认值为0;数值越大意味着优先级越低;可以通过 ps-el查看系统进程列表并找到NI标记列对应的优先级
    • 实时优先级(从0——99):越高的实时优先级级数意味着进程优先级越高
    • 二者互不交互

4.3.3 时间片

  • 时间片表示进程在被抢占前所能持续运行的时间。
  • 调度策略必须确定一个默认的时间片;
  • Linux的CFS调度器并没有直接划分时间片到进程,而是将处理器的使用比例划分给了进程。也就是说,其抢占时机取决于新的可执行程序消耗了多少处理器使用比,如果消耗的使用比比当前进程小,则新进程立即投入运行抢占当前进程。

4.3.4 调度策略的活动

4.4 linux调度算法

4.4.1 调度器类

  1. Linux调度器是以模块方式提供的(也就是调度器类),目的是允许不同类型的进程可以有针对性地选择调度算法
  2. 调度器类允许多种不同的可动态添加的调度算法并存,调度属于自己范畴的进程;
  3. 调度器代码会按照优先级顺序遍历调度类,拥有一个可执行进程的最高优先级的调度器类胜出,去选择下面要执行的那一个程序;

4.4.2 Unix系统中的进程调度

Unix使用的调度算法是分配绝对的时间片,这样就会引发固定的切换频率,不利于公平性。 而Linux采用的CFS完全摒弃了时间片,分配给进程一个处理器使用比重,保证恒定的公平性和变动的切换频率。

4.4.3 公平调度(CFS)

  • CFS的出发点基于一个简单的理念:进程调度的效果应当如同系统具备一个理想中的完美任务处理器。
  • CFS的做法如下:
    • 允许每个进程运行一段时间、循环轮转、选择运行最少的进程作为下一个运行进程;
    • nice值作为进程获得的处理器运行比的权重 即:绝对的nice值不再影响调度决策,它们的相对值才会影响处理器时间的分配比例——几何加权。
    • 每个进程都按照其权重在全部的可运行进程中所占的比例对应的“时间片”来运行
  • 目标延迟:无限小调度周期的近似值
  • 最小粒度:每个进程获得的时间片底线,默认为1ms。
  • 没有时间片概念但是仍需维持时间记账。

4.5 linux调度的实现

——即CFS调度算法的实现。

四个组成部分:

- 时间记账
- 进程选择
- 调度器入口
- 睡眠和唤醒

4.5.1 时间记账

  • 所有的调度器都必须对进程的运行时间做记账;
  • CFS使用调度器实体结构来追踪运行记账
  • 1.调度器实体结构
    • CFS使用调度器实体结构来追踪进程运行记账:
  • 2.虚拟实时
    • CFS使用了vruntime变量来存放进程的虚拟运行时间,用来表示进程到底运行了多少时间,以及它还应该运行多久。
    • 这个虚拟运行时间是加权的,与定时器节拍无关。
    • 虚拟运行时间以ns为单位。 
    • 相关的函数是updatecurr(),它计算了当前进程的执行时间并存放入变量deltaexec中,然后又将运行时间传递给_updatecurr();
    • _updatecurr()根据当前可运行进程总数对进行时间进行加权计算,最终将权重值与当前运行进程的vruntime值相加。 

4.5.2 进程选择

  • CFS算法核心:选择具有最小vrntime的任务
  • 具体做法:利用红黑树rbtree(以节点形式存储数据的二叉树)
  • 举例:
    • 选择下一个任务:从根节点中序遍历二叉树,一直到叶子节点(也就是vrntime最小的进程);
    • 向树中加入进程:在进程变为可执行状态或者通过fork()调用第一次创建进程;
    • 从树中删除进程:发生在进程阻塞或者终止的时候

**Linux中,红黑树被称为rbtree,是一个自平衡二叉搜索树,是一种以树节点形式存储的数据,这些数据会对应一个键值,可以通过这些键值来快速检索节点上的数据,而且检索速度与整个树的节点规模成指数比关系。 **

  1. 挑选下一个任务:

    节点键值是可运行进程的虚拟运行时间,进程选择算法是【运行rbtree树种最左边叶子节点所代表的那个进程】,函数是picknextentity() 

  2. 向树中加入进程:
    • 发生在进程被唤醒或者通过fork调用第一次创建进程时。
    • 函数enqueueentity():更新运行时间和其他一些统计数据,然后调用enqueueentity()。 函数enqueue_entity():进行繁重的插入工作,把数据项真正插入到红黑树中: 
  3. 从树中删除进程
    • 删除动作发生在进程堵塞或终止时。
    • 相关函数是dequeueentity()和dequeueentity(): 

4.5.3 调度器入口

  1. 进程调度的主要入口点是函数schedule(),定义在kernel/sched.c中;这正是内和其他部分用于调度进程调度器的入口
  2. 这一函数最重要的工作就是调用picknextstate(),依次检查每一个调度类,并从最高优先级的调度类中,选择最高优先级进程

4.5.4 睡眠和唤醒

  • 进程休眠一定是为了等待一些事件

    • 进程把自己标记成休眠状态,从可执行红黑树中移除;
    • 放入等待队列——由等待某些时间发生的进程组成的链表,内核用wakequeuehead_t来代表等待队列

3. 唤醒操作由函数wake_up()进行

- 它会调用函数try_to _wake_up()将进程设置为TASK_RUNNING状态,调用enqueue_task()将进程放入红黑树中
- 当然,也存在虚假唤醒进程的状态

4.6 抢占和上下文切换

  • 上下文切换由定义在kernel/sched.c中的context_switch()函数负责,每当一个新的进程被选出来准备运行的时候,schedule()就会调用该函数:

    • 调用switch_mm(),负责把虚拟内存从上一个进程映射切换到新的进程中;
    • 调用switch_to(),负责从上一个进程的处理器状态切换到新进程的处理器状态
  • Linux系统支持内核抢占

    • 只要没有锁,内核就可以进程抢占;
    • 为了支持抢占,每个进程的threadinfo都加入了preemptcount计数器(初值为0,每当使用锁的时候就加1,释放锁的时候数值减1),当数值为0的时候,内核就可以抢占
  • 内核抢占发生在:
    • 中断处理程序正在执行且返回内核空间之前;
    • 内核代码再一次具有可抢占性的时候;
    • 内核中的任务显式地调用schedule函数

参考资料

linux内核设计与实现

时间: 2024-08-14 01:15:55

20135239 益西拉姆 linux内核分析 读书笔记之第四章的相关文章

20135239益西拉姆 Linux内核分析 汇编一个简单的c程序并分析其指令过程

益西拉姆+<Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 第一周linux内核分析 学习笔记 一.计算机是如何工作的? 什么是冯诺依曼体系结构? 简单来讲就是存储程序计算机,而存储程序计算机又是指从硬件角度来看, X86汇编基础 学习笔记 详细内容都写在笔记中.再次不多说. 总结:以前一直搞不太懂汇编代码,学的不明不白,虽然现在也是学的不是太明白,至少知道了各个代码什么意思,以及该如何表现,这让我觉得老师的课时

20135239 益西拉姆 linux内核分析 可执行程序的装载

益西拉姆 + 原创作品请勿转载 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 ” week 7 可执行程序的装载 1.预处理.编译.链接和目标文件的格式 从c语言到可执行程序的由来过程 可执行文件的创建——预处理.编译和链接 以helloworld为例 -s assembler 汇编 gcc -o hello hello.o -m32 是把hello.o链接成可执行文件. ELF格式的文件是怎么回事? v

20135239益西拉姆 Linux内核分析 进程的描述和进程的创建

[益西拉姆 原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000] 第六周 进程的描述和进程的创建 一. 进程的描述 进程控制块PCB——task_struct 为了管理进程,内核必须对每个进程进行清晰的描述,进程描述符提供了内核所需了解的进程信息. struct task_struct数据结构很庞大 Linux进程的状态与操作系统原理中的描述的进程状态似乎有所不同,比如就绪状态和运行状态都是

20135239 益西拉姆 linux内核分析 进程的切换和系统的一般执行过程

week 8 进程的切换和系统的一般执行过程 [ 20135239 原文请转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000] 一.进程调度与进程调度的时机分析 操作系统原理中介绍了大量进程调度算法,这些算法从实现的角度看仅仅是从运行队列中选择一个新进程,选择的过程中运用了不同的策略而已.对于理解操作系统的工作机制,反而是进程的调度时机与进程的切换机制更为关键. 不同类型的进程有不同的调度需求 第一

20135239 益西拉姆 linux内核分析 跟踪分析Linux内核的启动过程

回顾 1.中断上下文的切换——保存现场&恢复现场 本节主要课程内容 Linux内核源代码简介 1.打开内核源代码页面 arch/目录:支持不同CPU的源代码:其中的X86是重点 init/目录:内核启动相关的代码基本都在该目录中(比如main.c等) start_kernel函数就相当于普通C程序的main函数 kernel/目录:Linux内核核心代码在kernel目录中 README 介绍了什么是Linux,Linux能够在哪些硬件上运行,如何安装内核源代码等 构造一个简单的linux系统m

20135239 益西拉姆 linux内核分析 使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用

https://drive.wps.cn/preview#l/759e32d65654419cb765da932cdf5cdc 本次直接在wps上写的,因为不能连同图片一起粘贴过来,一个一个粘比较费时,所以弄了个wps链接,只能下载之后观看,但是很快就好啦,不要介意,嘿嘿.

Linux内核架构读书笔记 - 2.5.3 处理优先级

1 优先级的内核表示 内核使用 0 - 139 表示内部优先级,值越低,优先级越高.0 -99 实时进程使用 nice 值 [-20,19]映射到范围100 - 139,如下图 内核定义了一系列宏来辅助优先级之间的转换 sched.h 1 /* 2 * Priority of a process goes from 0..MAX_PRIO-1, valid RT 3 * priority is 0..MAX_RT_PRIO-1, and SCHED_NORMAL/SCHED_BATCH 4 *

Linux内核架构读书笔记 - 2.5.2 数据结构

调度系统各个组建关系如下 激活调度器两种方法:进程睡眠或其他原因放弃CPU,周期性检测 上述两个组件统称为通用调度器或核心调度器. 调度器用于判断接下来运行那个进程,内核支持不同的调度策略( 完全公平调度 实时调度 无事可做的空闲调度进程) 调度器被调用时候 需要执行体系相关的进程上下文切换 每个进程属于某个调度器类,各个调度器负责管理所属进程,通用调度器不涉及进程管理,都由调度器来 下面分别讲述: task_struct 成员 sched.h 1 struct task_struct { 2

Linux内核架构读书笔记 - 2.5.4 核心调度器

什么是核心调度器? 参考前面的博文http://www.cnblogs.com/songbingyu/p/3696414.html 1 周期性调度器 作用: 管理内核中与整个系统和各个进程的调度相关的统计量 负责当前调度类的周期性调度方法 kernel/sched.c 1 /* 2 * This function gets called by the timer code, with HZ frequency. 3 * We call it with interrupts disabled. 4