Java Virtual Machine 动态的加载,链接和初始化类和接口。那么,Class 二进制文件是怎样被 JVM 加载到内存中的?JVM 如何描述一个 Java 类?类或接口怎么才能让 JVM执行?类或接口又是怎么初始化的?
带着这些问题,本文将讨论:
- JVM 加载
- JVM 链接
- JVM 初始化
一个 Class 文件被 JVM 读取,然后经过加载,链接和初始化这些逻辑阶段,变成可被 JVM 识别的格式,最终在内存中的体现就是一个 java.lang.Class 对象。在虚拟机规范中并没有规定这些阶段按顺序进行,HotSpot VM 有些阶段就是交叉进行的。
1. JVM 加载
加载就是从字节流中,按照 Class 文件的格式解析出类或接口,并创建相应的类或接口。当 JVM 启动时,将会使用如下几种类加载器:
- Bootstrap Class Loader
启动类加载器,它负责加载位于 <JAVA_HOME>\jre\lib 目录的 Java 核心类库(如 rt.jar),它是使用本地方法编写,不是一个 Java 类。由它加载的类,当调用 getClassLoader() 时,返回 null 。
- Extension Class Loader
扩展类加载器,它负责加载位于 <JAVA_HOME>\jre\lib\ext 目录中的 Class 文件,由 sun.misc.Launcher$ExtClassLoader 实现。
- System Class Loader
系统类加载器,也叫应用程序类加载器(Application class loader),它负责加载位于 CLASSPATH 环境变量路径上的类库。程序的默认加载器就是它,当然也可以自定义加载器。它由 sun.misc.Launcher$AppClassLoader 实现。
- User-Defined Class Loader
用户自定义类加载器。
加载的流程是:验证魔数和主从版本号;读取 Class 文件中的静态常量池定义,创建运行时常量池并返回一个句柄;读取访问控制符;读取 this 类和其全限定名称(在常量池中);super 类和全限定名称;读取接口信息,包括本地和父类接口;读取字段信息,并分配存储;读取方法信息;创建 instanceKlass (JVM内部描述Java类的对象)根据以上读取的信息赋值;创建镜像类 java.lang.Class,初始化静态域;通知类已加载。
在运行时,类或接口的全限定名称并不是其唯一标识,而是使用名字和加载它的类加载器共同标识的。所以当使用 instanceof,equals() 判断两个类是否相同时的必要条件是,两个类由同一个类加载器加载。在 JVM 内部有一个系统字典,它记录了系统加载的所有类,类加载器等信息,为其他模块提供检索服务。
为了避免重复加载,和保证 Java 类型体系的安全,JVM 在加载时,使用双亲委派模型(Parents Delegation Model),它表示类加载器的一种层次关系,使用组合来实现。
当一个类加载器加载一个类时,首先它不会先尝试自己加载这个类,而是把这个加载请求委派给父类加载器,每层均是如此,把这个请求逐层上传,直到顶层的启动类加载器,只有当父类加载器反馈自己无法完成加载时,子类加载器才会自己去加载。
JVM 为每一个加载的 Java 类创建一个 instanceKlass 对象,来表示 Java 类。它包含运行一个 Java 类所需的所有信息,其成员变量会在解析阶段完成初始化。
2. JVM 链接
class 文件之间通过符号引用建立关系(符号引用以字符串的形式存在),JVM 动态加载类或接口,通过动态链接把它们链接起来,实现方法调用和相互引用。链接可分为验证,准备和解析。
- 验证
用于确保 Class 文件符合 JVM 的要求,验证字节码的正确性,验证类的元数据信息。
- 准备
为类变量分配内存并赋值各类型的默认值,如果是 final static 修饰的字段,直接会被初始化为指定的值。
- 解析
把常量池中的符号引用转换为直接引用,即运行时实际内存地址,主要有类,接口,字段和方法这 4 类符号引用。
3. JVM 初始化
初始化阶段,就是执行 Java 的初始化方法,有两个方法:一个是类初始化方法 <clinit>(静态块,语句初始化);一个是实例初始化方法 <init>(构造函数),这两个方法都是由编译器自动生成的,在初始化阶段由 JVM 自身隐式调用。
JVM 会保证父类先于子类执行 <clinit> 方法,也就是说父类的静态块和变量初始化操作先于子类的执行,在多线程环境下,JVM 会保证 <clinit> 方法的线程安全。