周子轩 原创作品 转载请注明出处
《Linux内核分析》MOOC课程:http://mooc.study.163.com/course/USTC-1000029000
一、视频笔记
1. 进程描述符 task_struct
为了管理进程,内核必须对每个进程进行清晰的描述,进程描述符提供了内核所需了解的进程信息。进程描述符task_struct的源码链接:http://codelab.shiyanlou.com/xref/linux-3.18.6/include/linux/sched.h#1235。其结构很庞大,初次接触我们只关注与进程创建与管理密切相关的一些字段。如:
- 进程的标识 pid
- 所有进程链表 struct list_head tasks;
- 程序创建的进程具有父子关系,在编程时往往需要引用这样的父子关系。进程描述符中有几个域用来表示这样的关系
- Linux为每个进程分配一个8KB大小的内存区域,用于存放该进程两个不同的数据结构:Thread_info和进程的内核堆栈
- struct thread_struct thread; //CPU-specific state of this task
关于task_struct的详细描述,可参见task_struct结构描述
当然除了应该了解task_struct中存储了哪些信息以外,还应该学习这些信息是如何组织的。比如所有的进程描述符是如何通过其内的一个数据成员 struct list_head tasks双向链接起来的,详见网上的一篇文章:linux 内核 task_struct 结构体字段分析
2. 进程的创建
在Linux应用程序的开发中,可以通过fork、vfork和clone等API来创建一个子进程,它们在Linux内核中对应的系统调用分别为sys_fork、sys_vfork和sys_clone函数,而这些函数最终都会调用do_fork完成子进程的创建。do_fork主要是复制了父进程的task_struct,然后修改必要的信息,从而得到子进程的task_struct。主要修改了以下信息:
- pid
- 进程链表
- 给新进程分配一个新的内核堆栈
- 修改子进程的IP为ret_from_fork,当子进程获得调度时就是从这里开始执行的
- 其它众多零碎字段的初始化,如运行时间设为0等
- 等等吧;
3. 子进程的执行
刚fork出来的子进程是从ret_from_fork开始执行的,然后跳转到syscall_exit(http://codelab.shiyanlou.com/xref/linux-3.18.6/arch/x86/kernel/entry_32.S#290),从系统调用中返回。看下面的源代码截图:
从用户态代码来看,fork()函数返回了两次,即在父子进程中各返回一次!但是子进程的返回值是0,从返回值我们就可以判断出返回后接下来要执行的代码是中父进程还是子进程中。
二、实验
实验仍然中实验楼的虚拟机里做,这真的是学习的一个好地方,不信,你来http://www.shiyanlou.com/courses/195。
1. 进入虚拟机,打开终端,这命令行依次敲入以下命令
- cd LinuxKernel
- rm menu -rf
- git clone https://github.com/mengning/menu.git
- cd menu
- mv test_fork.c test.c
- make rootfs
一切正常的话,这时候我们简易的内核系统就启动起来了,这menuos种,输入help,就可以看到新添加的命令fork,输入fork,看看效果吧,有图为证:
2. gdb上述的fork命令
关闭QEMU窗口,中命令行中输入:
qemu -kernel ../linux-3.18.6/arch/x86/boot/bzImage -initrd ../rootfs.img -s -S
再次启动MenuOS,并暂停等待gdb调试。
然后水平分割命令行窗口,这新窗口中依次输入以下命令,启动调试:
gdb
file linux-3.18.6/vmlinux
target remote:1234
然后再设置以下断点:
b sys_clone
b do_fork
b dup_task_struct
b copy_process
b copy_thread
b ret_from_fork