.NET是如何将源代码编译成托管代码,又是如何将托管代码合并成程序集?首先,我们先了解下常见的CLR,.NET Framework,IL等名词。
一,说说常见的名词
CLR(公共语言运行 时,Common Language Runtime)和Java虚拟机一样也是一个运行时环境,是一个可由多种编程语言使用的运行环境。CLR的核心功能包括:内存管理、程序集加载、安全 性、异常处理和线程同步,可由面向CLR的所有语言使用。并保证应用和底层操作系统之间必要的分离。CLR是.NET Framework的主要执行引擎。
IL(中间语言):编译器编译源代码时生成的代码。
.NET Framework 中包含了Framework类库(Framework Class Library,FCL)。FCL是一组DLL程序集的统称,其中包含数千个类型定义和功能。
二,如何将源代码编译成托管代码
将源代码编译成托管模块,就是本地代码编译器根据机器的CPU架构(比如X86,X64或IA64)编译生成IL(中间代码)的过程。IL是托管代码,需
要CLR来管理它的执行。因此就需要机器上安装了CLR,CLR目前作为.NET
Framework的一部分。当然,编译过程中除了生成IL,编译器还需要在托管模块中生成完整的元数据。
注意:我们可以将编译器理解为语法检查器,编译器负责检查源代码,确保我们写的代码合法并且有意义,CLR不关心开发人员使用哪种编程语言,因此不同的公司可以面向CLR用自己的语言和编译器。我们可以用支持CLR的任何一种语言创建源代码文件,然后用对应的编译器检查语法和分析源代码。CLR输出对你的意图进行描述的代码。
无论哪一种编译器,结果都是一个托管模块(managed
module).托管模块是一个标准的32位 Microsoft Windows
可移植执行体(PE32)文件,或者是一个标准的64位Windows可移植执行体(PE32+)文件,他们都需要CLR才能执行。顺便说一句,托管的程
序集总是利用Windows的数据执行保护(Data Execution Prevention,DEP)和地址空间布局随机化(Address
Space Layout
Randomization ASLR),这两个功能旨在增强整个系统的安全性。下面具体说明:
(1)PE32或者PE32+头: 标准的Windows
PE文件头,类似于“公共对象文件格式”(Common Object File
Format,COFF)头。如果这个头使用PE32格式,文件能在Windows的32位或64位版本上运行。如果这些头使用PE32+格式,文件只能
在Windows的64位版本上运行。这个头还标示了文件类型,包括GUI,CUI后者DLL,并包含一个时间标记来指出文件的生成时间。对于只包含IL
代码的模块,PE32(+)头的大多数信息会被忽视。对于包含本地CPU代码的模块,这个头包含了与本地CPU代码有关的信息。
(2)CLR头:包含使这个模块成为一个托管模块的信息(可有CLR和一些实用程序进行解释)。头中包含了需要CLR版本,一些标志(flag),托管
模块入口方法(Main方法)的MethodDef元数据标记(token),以及模块的元数据、资源、强名称、一些flag以及其他不太重要的数据项的
位置/大小。
(3)元数据:每个托管模块都包含元数据表。主要有两种类型的表:一种类型的表描述源代码中定义的类型和成员;另一种类型的表描述源代码应用的类型和成
员。由于编译器同时生成元数据和代码,把他们绑定一起,并嵌入最终生成的托管模块,所以元数据和它描述的IL代码永远不会失去同步。元数据能够元数据消除
了对本地C/C++头和库文件的需求;同时智能感知技术能够帮助我们写代码,因为指出了一个类型提供了那些方法属性字段事件等信息;元数据允许垃圾回收器
跟踪对象的生存期,有利于垃圾回收;元数据确保只执行类型安全的操作;元数据能够将一个对象的字段序列化到内存中发到其他机器进行反序列化。
(4)IL(中间语言)代码:编译器编译源代码时生成的代码。在运行时,CLR将IL编译成本地CPU指令。
三,如果托管代码合并成程序集
CLR通常是和程序集一起工作的,而不是模块。程序集是一个或多个模块/资源文件的逻辑分组。程序集是重用、安全性以及版本控制最小单元。既可以生成单文
件或者多文件的程序集。程序集相当于一个“组件”。一些托管模块和资源(或数据)文件准备交由一个工具处理。该工具生成独立一个PE32(+)文件来表示
文件的逻辑性分组。实际发生的事情是,这个PE32(+)文件包含一个名为“清单”的数据块。清单是由元数据表构成的另外一种集合。这些表描述了构成程序
集的文件,有程序集中的文件实现的公开导出类型,以及与程序集关联在一起的资源或数据文件。