linux装载可执行程序简析

朱宇轲 + 原创作品转载请注明出处 + 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC-1000029000

linux中主要的可执行文件为ELF文件,我们可以将它装载到自己的程序中,这次我们就将分析linux装载可执行程序的过程。

首先明确一点,装载可执行程序有两种方式:静态链接与动态链接。所谓静态链接,就是在程序执行之前完成所有链接工作,组成一个可执行文件,放到内存执行。这样做的缺点是,当有多个文件要链接同一份可执行文件时,内存中会有多份这个可执行文件的拷贝,这在一定程度上就是一种对内存的浪费。因此,人们又发明了动态链接的概念,它指的是程序执行前并不将所有的模块组装在一起,而是在需要用到这个模块的时候再完成链接工作,这样相比静态链接就更加灵活,也节省了内存。

动态链接分为装载时动态链接和运行时动态链接,大家可有兴趣可以进一步了解一下。

基础知识普及完毕,接着我们来分析linux具体是如何装载可执行程序的。

linux装载可执行程序的系统调用是execve,它和fork函数一样,在执行的过程中会更改执行完毕后返回的代码段。

它的工作是首先读入传入的文件名、参数和环境变量,然后调用解析链表寻找解析该可执行文件的结构:

list_for_each_entry(fmt, &formats, lh) {
        if (!try_module_get(fmt->module))
            continue;
        read_unlock(&binfmt_lock);
        bprm->recursion_depth++;
        retval = fmt->load_binary(bprm);
        read_lock(&binfmt_lock);

比如我们读入了ELF文件,那它就要在链表中寻找ELF文件的解析器。这里注意运用了观察者模式:linux会将各种解析器预先注册,当添加了新的解析器后,就会更改解析的链表。比如ELF文件中是这样的:

static struct linux_binfmt elf_format = {
  .module     = THIS_MODULE,
  .load_binary    = load_elf_binary,
  .load_shlib = load_elf_library,
  .core_dump  = elf_core_dump,
  .min_coredump   = ELF_EXEC_PAGESIZE,
};

 在这里,它定义load_lef_binary为解析器load_binary的具体实现(其实就是一种多态),之后将该结构体注册到解析器的链表中,从此再遇到ELF文件,搜索解析器链表,就可以找到专门解析这种文件的解析器了。

static int __init init_elf_binfmt(void)
{
    register_binfmt(&elf_format);
    return 0;
}

在ELF自己的解析函数load_elf_binary中,对于静态链接和动态链接,处理过程是不一样的。

if (elf_interpreter) {
		unsigned long interp_map_addr = 0;

		elf_entry = load_elf_interp(&loc->interp_elf_ex,
					    interpreter,
					    &interp_map_addr,
					    load_bias);
		if (!IS_ERR((void *)elf_entry)) {
			/*
			 * load_elf_interp() returns relocation
			 * adjustment
			 */
			interp_load_addr = elf_entry;
			elf_entry += loc->interp_elf_ex.e_entry;
		}
		if (BAD_ADDR(elf_entry)) {
			retval = IS_ERR((void *)elf_entry) ?
					(int)elf_entry : -EINVAL;
			goto out_free_dentry;
		}
		reloc_func_desc = interp_load_addr;

		allow_write_access(interpreter);
		fput(interpreter);
		kfree(elf_interpreter);
	} else {
		elf_entry = loc->elf_ex.e_entry;
		if (BAD_ADDR(elf_entry)) {
			retval = -EINVAL;
			goto out_free_dentry;
		}
	}...start_thread(regs,elf_entry,bprm->p);

对于动态链接,这段代码直接执行elf_interpreter的部分,此时会装载一个动态链接器,由它再进行具体的内存管理,这里暂且不讨论。

对于静态链接,则直接执行else的部分,此时会将ELF代码段的入口地址付给elf_entry变量。

之后会执行start_thread函数,该函数将进程上下文压栈,同时将elf_entry赋给ip,对于静态链接来说,也就是使代码跳出内核态后执行的第一条代码就是ELF的入口处代码。

这样一来,就可以实现装载可执行程序的功能了。

总结:

  本博客讨论了linux装载可执行程序的过程,装载的可执行程序分为静态和动态链接两种方式。在解析可执行文件时,linux利用了多态机制和观察者模式,并在解析过程中改变内核堆栈的EIP地址,从而实现将执行的下一条代码更改到可执行程序的作用。

实验过程是基于实验楼的系统,这里简单显示几张截图:

时间: 2024-09-30 07:57:49

linux装载可执行程序简析的相关文章

Linux Kernel Makefile简析 之 make zImage

本文将简要分析Linux Kernel编译zImage的过程.读者需具备GNU Make.Bash Shell.Python脚 本.编译器.链接器等方面的基础知识.虽然重点是分析kernel的构建过程,但是也会顺带的分析一些 其他的小的知识点.我们坐车去远行,欣赏沿途的风景,并不会妨碍我们最终抵达我们的目的地,不是 吗? 先描述一下具体开发环境: . host os: ubuntu 14.04 server LTS . cross toolchain: crosstool-ng生成的交叉编译器

Linux系统启动流程简析

在日常生活中,我们开机的操作一般为按下电源键,等待系统自己起来就好了.这开机的过程看似简单,但其中却包含着十分复杂的各种小过程.以Linux为例,其流程为下图所示: 一.POST 首先,先介绍下BIOS和POST的概念. BIOS:Basic Input Output System,即基本输入输出系统,它是一组固化到计算机内主板上一个ROM芯片上的程序,它保存着计算机最重要的基本输入输出的程序.开机后自检程序和系统自启动程序,它可从CMOS中读写系统设置的具体信息.其主要功能是为计算机提供最底层

Linux目录结构简析

Linux继承了unix操作系统结构清晰的特点.在linux下的文件结构非常有条理.但是,上述的优点只有在对linux相当熟悉时,才能体会到.现在,虫虫就把linux下的目录结构简单介绍一下. /vmlinuz 我们已经知道,每一个linux都有一个内核(vmlinuz),我们在这个内核上添加上可以完成各种特定功能的模块,每个模块就体现在 linux中各种不同的目录上.当然,各种不同的发行套件,其目录有细小的差别,但主要结构都是一样的.我们还要将linux的功能模块和各种应用程序结合起来,这样,

Linux网络性能优化方法简析

Linux网络性能优化方法简析 2010-12-20 10:56 赵军 IBMDW 字号:T | T 性能问题永远是永恒的主题之一,而Linux在网络性能方面的优势则显而易见,这篇文章是对于Linux内核中提升网络性能的一些优化方法的简析,以让我们去后台看看魔术师表演用的盒子,同时也看看内核极客们是怎样灵活的,渐进的去解决这些实际的问题. AD:2014WOT全球软件技术峰会北京站 课程视频发布 对于网络的行为,可以简单划分为 3 条路径:1) 发送路径,2) 转发路径,3) 接收路径,而网络性

Linux下df与du命令输出区别简析

PS:前些时间有童鞋问我,为什么他的服务器里用df和du命令查询的文件大小显示不一样.其实这两个命令查询原理是不一样的,简析如下: 1.正常情况下,df和du输出结果都会有差距 du -sh命令通过将指定文件系统中所有的目录.符号链接和文件使用的块数累加得到该文件系统使用的总块数: 而df命令通过查看文件系统磁盘块分配图得出总块数与剩余块数. 文件系统分配其中的一些磁盘块用来记录它自身的一些数据,如i节点,磁盘分布图,间接块,超级块等.这些数据对大多数用户级的程序来说是不可见的,通常称为Meta

linux网络流控-htb算法简析

项目中用tc,htb做流控期间,研究了htb(分层令牌桶)算法的实现.觉得这种思想在类似与有消费优先级的生产者消费者场景中也很适用.该算法过于复杂,碍于嘴拙遂在标题中加了简析,只介绍核心思想和关键代码的实现. 一个栗子: tc qdisc add dev eth0 root handle 1: htb tc class add dev eth0 parent 1: classid 1:1 htb rate 100mibps tc class add dev eth0 parent 1:1 cla

cgroup原理简析:进程调度

本篇来探究下cgroup对cpu的限制机制,前文提到过cgroup也是通过进程调度子系统来达到限制cpu的目的,因此需要了解下进程调度子系统. 因为是介绍cgroup的文章,因此只介绍进程调度中与cgroup密切关联的部分,详细完成的进程调度实现可参考进程调度的相关资料. 本文分为三个部分,首先介绍进程调度中的调度算法,在该基础上引入组调度,最后结合前面文章(cgroup原理简析:vfs文件系统)来说明上层通过echo pid >> tasks, echo n > cpu.shares等

CentOS的网络配置简析

我们在进行对CentOS的网络配置时,一般会从IP地址(IPADDR).子网掩码(NETMASK).网关(Gateway).主机名(HOSTNAME).DNS服务器等方面入手.而在CentOS中,又有着不同的命令或配置文件可以完成这些配置操作,接下来,我们将从ifcfg系命令,iproute2系命令以及配置文件3个方面来简析网络配置的方法. 一.ifcfg系命令 ifcfg系命令包括ifconfig,route,netstat和hostname. 1.ifconfig命令 用来配置一个网络接口.

JDK框架简析--java.lang包中的基础类库、基础数据类型

题记 JDK.Java Development Kit. 我们必须先认识到,JDK不过,不过一套Java基础类库而已,是Sun公司开发的基础类库,仅此而已,JDK本身和我们自行书写总结的类库,从技术含量来说.还是在一个层级上,它们都是须要被编译成字节码.在JRE中执行的,JDK编译后的结果就是jre/lib下的rt.jar,我们学习使用它的目的是加深对Java的理解,提高我们的Java编码水平. 本系列全部文章基于的JDK版本号都是1.7.16. 源代码下载地址:https://jdk7.jav