高级语言的运行机制
计算机高级语言按程序的执行方式可以分为编译型和解释型两种。
编译型语言是指使用专门的编译器,针对特定平台,也就是操作系统将某种高级语言源代码一次性翻译成可被该平台硬件执行的机器码,并包装成该平台所能识别的可执行性程序
的格式,这个转换过程称为编译,编译生成的可执行性程序可以脱离开发环境,在特定的平台上独立运行。
有些程序编译结束后,还可能需要对其他编译好的目标代码进行连接,即组装两个以上的目标代码模板生成最终的可执行性程序,通过这种方式实现低层次的代码复用。
因为编译型语言是一次性的编译成机器码,所以可以脱离开发环境独立运行,而且通常运行效率较高,但是因为编译型语言的程序被编译成特定平台上的机器码,因此编译生成的
可执行性程序通常无法移植到其他平台上运行,如果需要移植,则必须将源代码复制到特定的平台上,针对特定平台进行修改,至少也需要采用特定平台上的编译器重新编译。
现在的C,C++,Object-C,Pascal等高级语言都属于编译型语言。
解释型语言是指使用专门的解释器对源程序逐行解释成特定平台的机器码并立即执行的语言。
解释型语言通常不会进行整体性的编译和连接处理,解释型语言相当于把编译型语言中的编译和解释过程混合到一起同时完成。
可以这么认为:每次执行解释型语言的程序都需要进行一次编译,因此解释型语言的程序运行效率通常较低,而且不能脱离解释器独立运行。
但解释器语言有一个优势,跨平台比较容易,只需要提供特定平台的解释器即可,每个特定平台上的解释器负责将源程序解释成特定平台的机器码指令即可。解释型语言可以方便
的实现源程序级的一致,但这是以牺牲程序执行效率为代码的。
现在的javascript,ruby,Python,等语言都属于解释型语言。
Java程序的运行机制和JVM
Java语言比较特殊,由Java语言编写的程序需要经过编译步骤,但这个编译步骤并不会生成特定的平台的机器码,而是生成一种与平台无关的字节码,也就是*.class文件。
当然,这种字节码不是可执行的,必须使用Java解释器来解释执行。
可以这么认为,Java语言既是编译型语言,也是解释型语言,或者说,Java语言既不是纯粹的编译型语言,也不是纯粹的解释型语言。
Java程序的执行过程必须经过先编译,后解释这2个步骤。
Java源文件->使用Javac编译->编译生成*.class文件->使用Java解释执行前面的字节码文件->解释成特定平台的机器码。
Java语言里面负责解释执行字节码文件的是Java虚拟机,即JVM,Java virtual machine。JVM是可运行Java字节码文件的虚拟计算机。所有平台上的JVM向编译器提供相同的编程
接口,而编译器只需要面向虚拟机,生成虚拟机能理解的代码,然后由虚拟机来解释执行。在一些虚拟机的实现中,还会将虚拟机代码转换成特定系统的机器码执行,从而提高执
行效率。
当使用Java编译器编译Java程序时,生成的是与平台无关的字节码,这些字节码不面向任何具体平台,只面向JVM。
不同平台上JVM都是不同的,但他们都提供了相同的接口。JVM是Java程序跨平台的关键部分,只要为不同平台实现了相应的虚拟机,编译后的Java字节码就可以在该平台上运
行。显然,相同的字节码程序需要在不同的平台上运行,这几乎是不可能的,只有通过中间的转换器才可以实现,JVM就是这个转化器。
JVM是一个抽象的计算机,和实际的计算机一样,它具有指令集并使用不同的存取区域。它负责执行指令,还要管理数据,内存和寄存器。
Oracle公司制定的Java虚拟机规范在技术上规定了JVM的统一标准,具体定义了JVM的如下细节:
指令集+寄存器+类文件的格式+栈+垃圾回收堆+存储区。
Oracle公司制定这些规范的目的是为了提供统一的标准,最终实现Java程序的平台无关性。