Linux第六次实验——谢飞帆

原创作品转载请注明出处+《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

在Linux中,task_struct其实就是通常所说的PCB。该结构定义位于:

/include/linux/sched.h

task_struct比较庞大,大致可以分为几个部分:

进程状态（State）
进程调度信息（Scheduling Information）
各种标识符（Identifiers）
进程通信有关信息（IPC：Inter_Process Communication）
时间和定时器信息（Times and Timers）
进程链接信息（Links）
文件系统信息（File System）
虚拟内存信息（Virtual Memory）
页面管理信息（page）
对称多处理器（SMP）信息
和处理器相关的环境（上下文）信息（Processor Specific Context）
其它信息

其中比较重要的几个参数:

volatile long state;进程状态,可见/include/linux/sched.h文件中的宏,TASK_RUNNING等
unsigned int rt_priority;实时优先级
unsigned int policy;调度策略
pid_t pid;进程标识符
struct task_struct __rcu *real_parent;real parent
struct list_head children;list of my children
struct files_struct *files;系统打开文件

分析内核处理过程sys_clone

fork、vfork和clone三个系统调用实际上都是通过do_fork来实现进程的创建.
见如下语句:

return do_fork(clone_flags, newsp, 0, parent_tidptr, child_tidptr);

do_fork 函数

而do_fork函数真正实现复制是copy_process

long do_fork(unsigned long clone_flags,
          unsigned long stack_start,
          unsigned long stack_size,
          int __user *parent_tidptr,
          int __user *child_tidptr)
{

    ...

    p = copy_process(clone_flags, stack_start, stack_size,
             child_tidptr, NULL, trace);
  ...
}

copy_process函数

copy_process()主要完成进程数据结构，各种资源的初始化。

p = dup_task_struct(current);

(省略的IF语句)检查clone_flags参数,防止无效的组合进入
p = dup_task_struct(current);调用dup_task_struct()为新进程创建一个内核栈
判断权限及允许范围的代码
对子进程的描述符初始化和复制父进程的资源给子进程
- retval = sched_fork(clone_flags, p);完成调度相关的设置，将这个task分配给CPU
- if (retval)语句群,复制共享进程的的各个部分
- retval = copy_thread(clone_flags, stack_start, stack_size, p);复制父进程堆栈的内容到子进程的堆栈中去.这其中,copy_thread()函数中的语句p->thread.ip = (unsigned long) ret_from_fork;决定了新进程的第一条指令地址.

dup_task_struct()

static struct task_struct *dup_task_struct(struct task_struct *orig)
{
    struct task_struct *tsk;
    struct thread_info *ti;
    int node = tsk_fork_get_node(orig);
    int err;

    tsk = alloc_task_struct_node(node);
    if (!tsk)
        return NULL;

    ti = alloc_thread_info_node(tsk, node);
    if (!ti)
        goto free_tsk;

    err = arch_dup_task_struct(tsk, orig);
    if (err)
        goto free_ti;

    tsk->stack = ti;
# ifdef CONFIG_SECCOMP

    tsk->seccomp.filter = NULL;
# endif

    setup_thread_stack(tsk, orig);
    clear_user_return_notifier(tsk);
    clear_tsk_need_resched(tsk);
    set_task_stack_end_magic(tsk);

# ifdef CONFIG_CC_STACKPROTECTOR
    tsk->stack_canary = get_random_int();
# endif

    atomic_set(&tsk->usage, 2);
# ifdef CONFIG_BLK_DEV_IO_TRACE
    tsk->btrace_seq = 0;
# endif
    tsk->splice_pipe = NULL;
    tsk->task_frag.page = NULL;

    account_kernel_stack(ti, 1);

    return tsk;

free_ti:
    free_thread_info(ti);
free_tsk:
    free_task_struct(tsk);
    return NULL;
}

tsk = alloc_task_struct_node(node);为task_struct开辟内存
ti = alloc_thread_info_node(tsk, node);ti指向thread_info的首地址，同时也是系统为新进程分配的两个连续页面的首地址。
err = arch_dup_task_struct(tsk, orig);复制父进程的task_struct信息到新的task_struct里, (dst = src;)
tsk->stack = ti;task的对应栈
setup_thread_stack(tsk, orig);初始化thread info结构
set_task_stack_end_magic(tsk);栈结束的地址设置数据为栈结束标示(for overflow detection)

gdb跟踪sys_clone

用GDB来跟踪sys_clone,设置以下断点:

fork1.png

运行后首先停在sys_clone处:

然后是do_fork,之后是copy_process:

fork3.png

进入copy_thread:

fork4.png

在copy_thread中,我们可以查看p的值

fork5.png

但是回到copy_process后再查看,将得到一个value optimized out的提示,这是因为Linux内核打开gcc的-O2选项优化导致.如果想要关掉,可以参考:这里

fork6.png

ret_from_fork按照之前的分析被调用,跟踪到syscall_exit后无法继续.如果想在本机调试system call，那么当你进入system call时，系统已经在挂起状态了。如果想要跟踪调试system_call,可以使用kgdb等

fork7.png

新进程是从哪里开始执行的？

在之前的分析中,谈到copy_process中的copy_thread()函数,正是这个函数决定了子进程从系统调用中返回后的执行.

int copy_thread(unsigned long clone_flags, unsigned long sp,
    unsigned long arg, struct task_struct *p)
{
    ...

    *childregs = *current_pt_regs();
    childregs->ax = 0;
    if (sp)
        childregs->sp = sp;

    p->thread.ip = (unsigned long) ret_from_fork;

    ...
}

子进程执行ret_from_fork

ENTRY(ret_from_fork)
    CFI_STARTPROC
    pushl_cfi %eax
    call schedule_tail
    GET_THREAD_INFO(%ebp)
    popl_cfi %eax
    pushl_cfi $0x0202       # Reset kernel eflags
    popfl_cfi
    jmp syscall_exit
    CFI_ENDPROC
END(ret_from_fork)

执行起点与内核堆栈如何保证一致?

在ret_from_fork之前,也就是在copy_thread()函数中*childregs = *current_pt_regs();该句将父进程的regs参数赋值到子进程的内核堆栈,
*childregs的类型为pt_regs,里面存放了SAVE ALL中压入栈的参数
故在之后的RESTORE ALL中能顺利执行下去.

总结

Linux通过复制父进程来创建一个新进程,通过调用do_fork来实现
Linux为每个新创建的进程动态地分配一个task_struct结构.
为了把内核中的所有进程组织起来，Linux提供了几种组织方式，其中哈希表和双向循环链表方式是针对系统中的所有进程（包括内核线程），而运行队列和等待队列是把处于同一状态的进程组织起来
fork()函数被调用一次，但返回两次

文／uglyyouth（简书作者）
原文链接：http://www.jianshu.com/p/d843695f3ee8
著作权归作者所有，转载请联系作者获得授权，并标注“简书作者”。

时间： 2024-10-10 17:15:47

Linux第六次实验——谢飞帆的相关文章

Linux第7次实验——谢飞帆

原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 这一周的主要内容是可执行程序的装载. 一.那么首先来看一下编译链接的过程和ELF可执行文件格式 1.这张图简明扼要的说明了可执行程序的产生.? ?大概过程是这样的: ?.c文件汇编成汇编代码.asm, 然后再汇编成目标码.o, 然后链接成可执行文件a.out, 这时可执行文件就可以加载到内存中执行了. 2.举个例子(对hello wor

Linux第8次实验——谢飞帆

原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 1.理解进程上下文的切换机制,以及与中断上下文切换的关系用户态进程它在用户的时候,它没法直接调用schedule(),因为schedule是个内核函数,而且它也不是一个系统调用,没法直接调用它,只能间接的调用它,间接的调用schedule()的时机就是中断处理过程对于用户态进程,它要从当前运行中的进程切换出去的话,那么它就必须要进入

Linux第四次实验——谢飞帆

原创作品转载请注明出处 + <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 使用库函数API和C代码中嵌入汇编代码两种方式使用同一个系统调用,理解系统调用的工作机制. 本次实验选择24号和47号系统调用,分别获取当前用户uid(用户ID)和gid(组ID),即模拟Linux系统“id”命令. 编写两段代码,分别使用库函数API和C代码中嵌入汇编代码 uidgid.c(使用库函数API方式): 程序中通过调用ge

Linux下的ssh实验环境搭建与管理

Linux下的ssh实验环境搭建与管理实验环境服务端:xuegod-63 IP:192.168.1.63 客户端:xuegod-64 IP:192.168.1.64 客户端普通用户:ceshi 密码:123456 安装好扫描软件rpm -ivh /mnt/Packages/nmap-5.21-4.el6.x86_64.rpm 实验目标 1:SSHD服务介绍 2:SSHD服务安装配置 3:两Linux服务器之间数据拷贝 4:SSHD服务作用: 实验步骤 1:搭建环境 1):网桥模式

linux     第六章账号和权限管理

linux 第六章账号和权限管理享受生活热爱挑战明远分享每章一段话: 每一个优秀的人,都有一段沉默的时光.人总会有困难丶会被别人不理睬丶这个时候就是你最关键的时候,我们需要相信生活,不放弃,命运不会抛弃你,苦过方可甜. 今天我们要学习在linux中的用户和组的各种配置和管理,其实不要想命令多难记,其实多敲几遍就记住了,想它越简单你就越容易达成你的目标. 理论: Linux基于用户身份对资源访问进行控制我们先来看下linux用户帐号和组的分类: ①超级用户root

Linux内核分析：实验六--Linux进程的创建过程分析

刘畅原创作品转载请注明出处 <Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 概述本次实验在MenuOS中加入fork系统调用,并通过GDB的调试跟踪,近距离的观察Linux中进程创建的过程.阅读Linux进程部分的源码,结合起来理解Linux内核创建新进程的过程. Linux中对进程的描述 Linux中task_struct结构体用于描述系统中的进程,对应x86机器的此结构体定义放在了/include/li

linux内核分析第六次实验

使用gdb跟踪创建新进程的过程 rm menu -rf git clone https://github.com/mengning/menu.git mv test_fork.c test.c 执行fork,可以看到父进程子进程都输出了信息. 使用gdb进行调试 qemu -kernel linux-3.18.6/arch/x86/boot/bzImage -initrd rootfs.img -s -S gdbfile linux-3.18.6/vmlinuxtarget remote:1

linux第四章实验报告

Linux第四章用户和文件权限管理实验环境公司的linux主机即将提供给技术部作为开发服务器使用,根据部门内项目组的构成情况,首先需要建立相应的组账号.用户账号,并作为目录设置权限,还需要设置一个共用的数据存储目录,便于同事之间的数据交换. 需求描述 1.建立用户目录创建目录/tech/benet和/tech/accp,分别用于存放各项目组中用户账号的宿主文件夹.例如,kylin用户的宿主目录应位于/tech/benet/kylin. 2.添加组账户为两个项目组添加组账号benet,a

《Linux内核分析》实验一

陈智威,<Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 课堂学习笔记: 作业截图: 汇编代码堆栈分析: 总结:计算机的工作是通过一系列的代码使其硬件能够按照所编写的指令进行运行,而此次实验就是具体介绍了一下Linux的运行方式,用汇编的语言,即更贴切计算机的语言来向我们介绍了计算机是如何进行工作的.