Jvm(35.1),class文件结构----常量池(上)

[last updated:2014/11/27]

NO1.常量池在class文件的什么位置?

知道了常量池的位置后,然后让我们来揭秘常量池里究竟有什么东西吧~

NO2.常量池的里面是怎么组织的?

常量池的组织很简单,前端的两个字节占有的位置叫做常量池计数器(constant_pool_count),它记录着常量池的组成元素 常量池项(cp_info) 的个数。紧接着会排列着constant_pool_count-1个常量池项(cp_info)。如下图所示:

NO3.常量池项 (cp_info) 的结构是什么?

每个常量池项(cp_info) 都会对应记录着class文件中的某中类型的字面量。让我们先来了解一下常量池项(cp_info)的结构吧:

JVM虚拟机规定了不同的tag值和不同类型的字面量对应关系如下:

所以根据cp_info中的tag 不同的值,可以将cp_info 更细化为以下结构体:

CONSTANT_Utf8_info,CONSTANT_Integer_info,CONSTANT_Float_info,CONSTANT_Long_info,

CONSTANT_Double_info,CONSTANT_Class_info,CONSTANT_String_info,CONSTANT_Fieldref_info,

CONSTANT_Methodref_info,CONSTANT_InterfaceMethodref_info,CONSTANT_NameAndType_info,CONSTANT_MethodHandle_info,

CONSTANT_MethodType_info,CONSTANT_InvokeDynamic_info。

现在让我们看一下细化了的常量池的结构会是类似下图所示的样子:

NO4.常量池能够表示那些信息?

NO5. int和float数据类型的常量在常量池中是怎样表示和存储的?(CONSTANT_Integer_info, CONSTANT_Float_info)

Java语言规范规定了 int类型和Float 类型的数据类型占用 4 个字节的空间。那么存在于class字节码文件中的该类型的常量是如何存储的呢?相应地,在常量池中,将 int和Float类型的常量分别使用CONSTANT_Integer_info和

Constant_float_info表示,他们的结构如下所示:

举例:建下面的类 IntAndFloatTest.java,在这个类中,我们声明了五个变量,但是取值就两种int类型的10 和Float 类型的11f。

  1. package com.louis.jvm;
  2. publicclassIntAndFloatTest{
  3. privatefinalint a = 10;
  4. privatefinalint b = 10;
  5. privatefloat c = 11f;
  6. privatefloat d = 11f;
  7. privatefloat e = 11f;
  8. }

然后用编译器编译成IntAndFloatTest.class字节码文件,我们通过javap -v IntAndFloatTest 指令来看一下其常量池中的信息,可以看到虽然我们在代码中写了两次10 和三次11f,但是常量池中,就只有一个常量10 和一个常量11f,如下图所示:

从结果上可以看到常量池第#8 个常量池项(cp_info) 就是CONSTANT_Integer_info,值为10;第#23个常量池项 (cp_info) 就是CONSTANT_Float_info,值为11f。(常量池中其他的东西先别纠结啦,我们会面会一一讲解的哦)。

代码中所有用到 int 类型 10 的地方,会使用指向常量池的指针值#8 定位到第#8 个常量池项(cp_info),即值为 10 的结构体CONSTANT_Integer_info,而用到float类型的11f时,也会指向常量池的指针值#23来定位到第#23个常量池项(cp_info) 即值为11f的结构体CONSTANT_Float_info。如下图所示:

NO6. long和 double数据类型的常量在常量池中是怎样表示和存储的?(CONSTANT_Long_info、

CONSTANT_Double_info )

Java语言规范规定了 long 类型和 double类型的数据类型占用8 个字节的空间。那么存在于class 字节码文件中的该类型的常量是如何存储的呢?相应地,在常量池中,将long和double类型的常量分别使用CONSTANT_Long_info和 Constant_Double_info表示,他们的结构如下所示:

举例:建下面的类 LongAndDoubleTest.java,在这个类中,我们声明了六个变量,但是取值就两种Long 类型的-6076574518398440533L和Double类型的10.1234567890D。

  1. package com.louis.jvm;
  2. publicclassLongAndDoubleTest{
  3. privatelong a = -6076574518398440533L;
  4. privatelong b = -6076574518398440533L;
  5. privatelong c = -6076574518398440533L;
  6. privatedouble d = 10.1234567890D;
  7. privatedouble e = 10.1234567890D;
  8. privatedouble f = 10.1234567890D;
  9. }

然后用编译器编译成 LongAndDoubleTest.class 字节码文件,我们通过javap -v LongAndDoubleTest指令来看 一 下 其 常 量 池 中 的 信 息 , 可 以 看 到 虽 然 我 们 在 代 码 中 写 了 三 次 -6076574518398440533L 和 三 次 10.1234567890D,但是常量池中,就只有一个常量-6076574518398440533L和一个常量10.1234567890D,如下图所示:

从 结 果 上 可 以 看 到 常 量 池 第 #18 个 常 量 池 项 (cp_info) 就 是 CONSTANT_Long_info, 值为 -6076574518398440533L; 第 #26 个 常 量 池 项 (cp_info) 就 是 CONSTANT_Double_info, 值 为 10.1234567890D。(常量池中其他的东西先别纠结啦,我们会面会一一讲解的哦)。

代码中所有用到 long 类型-6076574518398440533L的地方,会使用指向常量池的指针值#18 定位到第 #18 个常量池项(cp_info),即值为-6076574518398440533L的结构体CONSTANT_Long_info,而用到double类型的

10.1234567890D 时 , 也 会 指 向 常 量 池 的 指 针 值 #26 来 定 位 到 第 #26 个 常 量 池 项 (cp_info) 即 值 为

10.1234567890D的结构体CONSTANT_Double_info。如下图所示:

NO7. String类型的字符串常量在常量池中是怎样表示和存储的?(CONSTANT_String_info、CONSTANT_Utf8_info)

对于字符串而言,JVM会将字符串类型的字面量以UTF-8 编码格式存储到在class字节码文件中。这么说可能有点摸不着北,我们先从直观的Java源码中中出现的用双引号"" 括起来的字符串来看,在编译器编译的时候,都会将这些字符串转换成CONSTANT_String_info结构体,然后放置于常量池中。其结构如下所示:

如上图所示的结构体,CONSTANT_String_info结构体中的string_index的值指向了CONSTANT_Utf8_info结构体,而字符串的utf-8编

码数据就在这个结构体之中。如下图所示:

请看一例,定义一个简单的StringTest.java类,然后在这个类里加一个"JVM原理" 字符串,然后,我们来看看它在 class文件中是怎样组织的。

  1. package com.louis.jvm;
  2. publicclassStringTest{
  3. private String s1 = "JVM原理"; 4. private String s2 = "JVM原理"; 5. private String s3 = "JVM原理";
  4. private String s4 = "JVM原理";
  5. }

将Java源码编译成StringTest.class文件后,在此文件的目录下执行 javap -v StringTest 命令,会看到如下的常量池信息的轮廓:

(PS :使用javap -v 指令能看到易于我们阅读的信息,查看真正的字节码文件可以使用HEXWin、NOTEPAD++、

UtraEdit 等工具。)

在面的图中,我们可以看到CONSTANT_String_info结构体位于常量池的第#15个索引位置。而存放"Java虚拟机原理" 字符串的 UTF-8编码格式的字节数组被放到CONSTANT_Utf8_info结构体中,该结构体位于常量池的第#16 个索引位置。上面的图只是看了个轮廓,让我们再深入地看一下它们的组织吧。请看下图:

由上图可见:"JVM原理"的UTF-8编码的数组是:4A564D E5 8E 9FE7 90 86,并且存入了CONSTANT_Utf8_info结构体中。

NO8. 类文件中定义的类名和类中使用到的类在常量池中是怎样被组织和存储的?(CONSTANT_Class_info)

JVM会将某个Java 类中所有使用到了的类的完全限定名 以二进制形式的完全限定名 封装成CONSTANT_Class_info结构体中,然后将其放置到常量池里。CONSTANT_Class_info 的tag值为 7 。其结构如下:

Tips:类的完全限定名和二进制形式的完全限定名

在某个Java源码中,我们会使用很多个类,比如我们定义了一个 ClassTest的类,并把它放到com.louis.jvm 包下,则 ClassTest类的完全限定名为com.louis.jvm.ClassTest,将JVM编译器将类编译成class文件后,此完全限定名在class文件中,是以二进制形式的完全限定名存储的,即它会把完全限定符的"."换成"/" ,即在class文件中存储的 ClassTest类的完全限定名称是"com/louis/jvm/ClassTest"。因为这种形式的完全限定名是放在了 class二进制形式的字节码文件中,所以就称之为 二进制形式的完全限定名。

举例,我们定义一个很简单的ClassTest类,来看一下常量池是怎么对类的完全限定名进行存储的。

  1. package com.jvm;
  2. import java.util.Date;
  3. publicclassClassTest{
  4. private Date date =new Date();
  5. }

将Java源码编译成ClassTest.class文件后,在此文件的目录下执行 javap -v ClassTest 命令,会看到如下的常量池信

息的轮廓:

如上图所示,在ClassTest.class文件的常量池中,共有 3 个CONSTANT_Class_info结构体,分别表示ClassTest 中用到的Class信息。 我们就看其中一个表示com/jvm.ClassTest的CONSTANT_Class_info 结构体。它在常量池中的位置是#1,它的name_index值为#2,它指向了常量池的第2 个常量池项,如下所示:

注意:

对于某个类而言,其class文件中至少要有两个CONSTANT_Class_info常量池项,用来表示自己的类信息和其父类信息。(除了java.lang.Object类除外,其他的任何类都会默认继承自java.lang.Object)如果类声明实现了某些接口,那么接口的信息也会生成对应的CONSTANT_Class_info常量池项。

除此之外,如果在类中使用到了其他的类,只有真正使用到了相应的类,JDK编译器才会将类的信息组成CONSTANT_Class_info常量池项放置到常量池中。如下图:

  1. package com.louis.jvm;
  2. import java.util.Date;
  3. publicclassOther{
  4. private Date date;
  5. publicOther()
  6. {
  7. Date da;
  8. }
  9. }

上述的Other的类,在JDK将其编译成class文件时,常量池中并没有java.util.Date对应的CONSTANT_Class_info 常量池项,为什么呢?

在Other类中虽然定义了Date类型的两个变量date、da,但是JDK编译的时候,认为你只是声明了"Ljava/util/Date"类型的变量,并没有实际使用到Ljava/util/Date类。将类信息放置到常量池中的目的,是为了在后续的代码中有可能会反复用到它。很显然, JDK在编译Other类的时候,会解析到Date类有没有用到,发现该类在代码中就没有用到过,所以就认为没有必要将它的信息放置到常量池中了。

将上述的Other类改写一下,仅使用new Date(),如下图所示:

  1. package com.louis.jvm;
  2. import java.util.Date;
  3. publicclassOther{
  4. publicOther()
  5. {
  6. new Date();
  7. }
  8. }

这时候使用javap -v Other ,可以查看到常量池中有表示java/util/Date的常量池项:

总结:

1.对于某个类或接口而言,其自身、父类和继承或实现的接口的信息会被直接组装成CONSTANT_Class_info 常量池项放置到常量池中;

  1. 类中或接口中使用到了其他的类,只有在类中实际使用到了该类时,该类的信息才会在常量池中有对应的

CONSTANT_Class_info常量池项;

  1. 类中或接口中仅仅定义某种类型的变量,JDK只会将变量的类型描述信息以UTF-8字符串组成CONSTANT_Utf8_info常量池项放置到常量池中,上面在类中的private Date date;JDK编译器只会将表示date的数据类型的"Ljava/util/Date"字符串放置到常量池中。

原文地址:https://www.cnblogs.com/qingruihappy/p/9691411.html

时间: 2024-08-11 09:47:46

Jvm(35.1),class文件结构----常量池(上)的相关文章

Jvm(35.2),class文件结构----常量池(下)

NO9.类中引用到的field字段在常量池中是怎样描述的?(CONSTANT_Fieldref_info, CONSTANT_Name_Type_info) 一般而言,我们在定义类的过程中会定义一些 field字段,然后会在这个类的其他地方(如方法中)使用到它.有可能我们在类的方法中只使用field字段一次,也有可能我们会在类定义的方法中使用它很多很多次. 举一个简单的例子,我们定一个叫Person的简单java bean,它有name和age两个field字段,如下所示: package co

Jvm(35),class文件结构----常量池

Class文件格式 常量池 先了解常量池中需要存放哪些内容,再讨论用什么类来存放这些内容. 常量池中存放的内容 Class文件中包含常量池,那么我就需要知道常量池会包含哪些内容,接下来才是关心class格式文件用什么类型来存放这些内容. 字面量(Literal) 字面量比较接近于Java语言层面的常量概念,如文本字符串.声明为 final的常量值等. 符号引用(Symbolic References)符号引用则属于编译原理方面的概念,包括了下面三类常量: 类和接口的全限定名(Fully Qual

对于JVM中方法区,永久代,元空间以及字符串常量池的迁移和string.intern方法

在Java虚拟机(以下简称JVM)中,类包含其对应的元数据,比如类的层级信息,方法数据和方法信息(如字节码,栈和变量大小),运行时常量池,已确定的符号引用和虚方法表. 在过去(当自定义类加载器使用不普遍的时候),类几乎是"静态的"并且很少被卸载和回收,因此类也可以被看成"永久的".另外由于类作为JVM实现的一部分,它们不由程序来创建,因为它们也被认为是"非堆"的内存. 在JDK8之前的HotSpot虚拟机中,类的这些"永久的"

Java堆、栈和常量池以及相关String的详细讲解(转)

一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方--处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据需求进行分配.你不能直接控制,也不能在程序中感觉到寄存器存在的任何迹象. ------最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制. 2. 堆栈(stack).位于通用RAM中,但通过它的"堆栈指针"可以从处理器哪里获得支持.堆栈指针若向下移动,则分配新的内存:若向上移动

Java堆、栈和常量池以及相关String的详细讲解(经典中的经典)

博客分类: Java综合 一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方——处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据需求进行分配.你不能直接控制,也不能在程序中感觉到寄存器存在的任何迹象. ------最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制. 2. 堆栈(stack).位于通用RAM中,但通过它的“堆栈指针”可以从处理器哪里获得支持.堆栈指针若向下移动,则分配新的

Java堆、栈和常量池以及相关String的详细讲解

一:在JAVA中,有六个不同的地方可以存储数据:   1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方--处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据需求进行分配.你不能直接控制,也不能在程序中感觉到寄存器存在的任何迹象. ------最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制. 2. 栈(stack).位于通用RAM中,但通过它的"堆栈指针"可以从处理器哪里获得支持.堆栈指针若向下移动,则分配新的内存:若向上移

Java堆/栈/常量池以及String的详细详解(转)------经典易懂系统

一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方——处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据需求进行分配.你不能直接控制,也不能在程序中感觉到寄存器存在的任何迹象. ------最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制. 2. 堆栈(stack).位于通用RAM中,但通过它的“堆栈指针”可以从处理器哪里获得支持.堆栈指针若向下移动,则分配新的内存:若向上移动,则释放那

Java中几种常量池的区分

转载自:https://tangxman.github.io/2015/07/27/the-difference-of-java-string-pool/ 在java的内存分配中,经常听到很多关于常量池的描述,我开始看的时候也是看的很模糊,网上五花八门的说法简直太多了,最后查阅各种资料,终于算是差不多理清了,很多网上说法都有问题,笔者尝试着来区分一下这几个概念. 1.全局字符串池(string pool也有叫做string literal pool) 全局字符串池里的内容是在类加载完成,经过验证

Java堆、栈和常量池以及相关String的讲解

一:在JAVA中,有六个不同的地方可以存储数据: 1. 寄存器(register). 这是最快的存储区,因为它位于不同于其他存储区的地方--处理器内部.但是寄存器的数量极其有限,所以寄存器由编译器根据需求进行分配.你不能直接控制,也不能在程序中感觉到寄存器存在的任何迹象. ------最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制. 2. 堆栈(stack).位于通用RAM中,但通过它的"堆栈指针"可以从处理器哪里获得支持.堆栈指针若向下移动,则分配新的内存:若向上移动