Java字节码常量池深度剖析与字节码整体结构分解

常量池深度剖析:

在上一次【https://www.cnblogs.com/webor2006/p/9416831.html】中已经将常量池分析到了2/3了,接着把剩下的分析完,先回顾一下我们编译的源文件为:

然后用javap -verbose查看一下编译字节码的信息,其中字符串相关的如下:

而对应用Hex Fiend来查看字符码的二进制文件的位置如下:

另外在继续分析之前再来回顾下常量的对应表,如下:

好下面开始,先来读一个字节来看一下是什么类型的常量:

查表可以看到是属于这个常量:

接着2个字节表示字符串的长度,所以往下数二个字节:

长度为4,则下往下数4个字节则为常量的内容:

用javap -verbose来确认一下是否也是它:

接下来继续读一个字节:

又是同样的常量类型,所以直接再读二个字节来看一下字符串的长度是多少:

长度为3,则往后再数3个字节:

看一下javap -verbose:

实际上"getA()I"就可以确认其方法名为getA,无参,并且返回值为整型,就可以完全的对应的源程序中的方法了。

接下来继续往下,读一个字节:

同样的类型,不多说,直接往下再看两个字节来决定字符串的长度:

占四个字节,于是乎往后再数四个字节:

对一下javap -verbose:

继续往下,读一个字节:

再数2个字节:

往下数四个字节:

对应于javap -verbose:

而同样的“setA(I)V”,表示方法名为setA,方法的参数为整型,无返回值,这样又可以定位到具体的唯一的方法了。

继续往下:

往下数10个字节:

对应javap -verbose:

代表源文件,再往下读:

长度为12,往下数12个字节:

而这两个信息描述了当前字节码文件是由哪个源文件编译出来的,所以这也是为啥在执行javap命令时有如下一个信息:

继续往下走:

此时不再是01类型的常量了,而是12,所以具体它代表什么类型还得查表,如下:

其第二项表示名称的索引,而第三项为描述的索引,所以往下读4个字节:

看一下javap -verbose所显示的:

其中方法名称为<init>表示是构造方法,而()V表示该构造方法不带参数没的返回值,也就是默认构造方法。

接下来继续:

又是同样的常量,所以直接往后数四个字节:

对应javap -verbose:

这个信息表示成员变量a,如下:

继续往下看:

字符串常量,对它的分析已经了如指掌了,往后数两个字节来看下字符串的长度:

长度为24,则往后数24个字节:

对应javap -verbose:

表示类的全局限定名,注意反应到字节码文件来说全局限定名都是以“/”分隔的,而不像我们看到的包名那样以“.”分隔的,继续往下:

再往下数两个字节:

16,则往下数16个字节:

对应javap -verbose:

表示当前类的父类的完全限制名,到此,常量池就全部分析完了~所以总结一下,对于一个类常量池的大小是不定的,那JVM如何在字体码文件中来知道常量池在哪结束呢?首先字符码能知道常量池的总大小,如下:

为24个,但是由于第一个为备用的,所以总常量池的大小为23,而每个常量第一个字节都是什么类型的常量,然后不同的常量其往下读几个字节都是确定的,所以这样就可以知道读到哪常量池就结束了。

字节码整体结构分解:

上面已经将整个常量池都已经分析完了,那之后还有那么多字节:

对应javap -verbose:

Classfile /Users/xiongwei/Documents/workspace/IntelliJSpace/jvm_lectue/out/production/classes/com/jvm/bytecode/MyTest1.class
  Last modified Aug 10, 2018; size 479 bytes
  MD5 checksum 4616561f95c24d6b04ea48a360437b8d
  Compiled from "MyTest1.java"
public class com.jvm.bytecode.MyTest1
  minor version: 0
  major version: 52
  flags: ACC_PUBLIC, ACC_SUPER
Constant pool:
   #1 = Methodref          #4.#20         // java/lang/Object."<init>":()V
   #2 = Fieldref           #3.#21         // com/jvm/bytecode/MyTest1.a:I
   #3 = Class              #22            // com/jvm/bytecode/MyTest1
   #4 = Class              #23            // java/lang/Object
   #5 = Utf8               a
   #6 = Utf8               I
   #7 = Utf8               <init>
   #8 = Utf8               ()V
   #9 = Utf8               Code
  #10 = Utf8               LineNumberTable
  #11 = Utf8               LocalVariableTable
  #12 = Utf8               this
  #13 = Utf8               Lcom/jvm/bytecode/MyTest1;
  #14 = Utf8               getA
  #15 = Utf8               ()I
  #16 = Utf8               setA
  #17 = Utf8               (I)V
  #18 = Utf8               SourceFile
  #19 = Utf8               MyTest1.java
  #20 = NameAndType        #7:#8          // "<init>":()V
  #21 = NameAndType        #5:#6          // a:I
  #22 = Utf8               com/jvm/bytecode/MyTest1
  #23 = Utf8               java/lang/Object
{
  public com.jvm.bytecode.MyTest1();
    descriptor: ()V
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=1, args_size=1
         0: aload_0
         1: invokespecial #1                  // Method java/lang/Object."<init>":()V
         4: aload_0
         5: iconst_1
         6: putfield      #2                  // Field a:I
         9: return
      LineNumberTable:
        line 3: 0
        line 4: 4
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0      10     0  this   Lcom/jvm/bytecode/MyTest1;

  public int getA();
    descriptor: ()I
    flags: ACC_PUBLIC
    Code:
      stack=1, locals=1, args_size=1
         0: aload_0
         1: getfield      #2                  // Field a:I
         4: ireturn
      LineNumberTable:
        line 7: 0
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       5     0  this   Lcom/jvm/bytecode/MyTest1;

  public void setA(int);
    descriptor: (I)V
    flags: ACC_PUBLIC
    Code:
      stack=2, locals=2, args_size=2
         0: aload_0
         1: iload_1
         2: putfield      #2                  // Field a:I
         5: return
      LineNumberTable:
        line 11: 0
        line 12: 5
      LocalVariableTable:
        Start  Length  Slot  Name   Signature
            0       6     0  this   Lcom/jvm/bytecode/MyTest1;
            0       6     1     a   I
}
SourceFile: "MyTest1.java"

目前还分析不了,因为还缺少知识理论,所以先来补一补知识,先来对字节码的整体结构有一个了解,先来看张图:

目前已经学习了前三个结构,如下:

接着来了解新的字节结构,接下来是“Access Flags”,表示访问修饰符:

如:public、public static、public abstract、private、protected等。

接着往下表示当前类的名字,如下:

再往下表示父类的名字:

接下来表示接口相关的信息:

其中可以发现一个细节:

父类的字节数是确定的,而接口是不确实的,这也跟java的单继承多实现的特性吻和。

继续往下则是字段相关的信息:

接下来由是类的方法相关的一些信息:

这个就比较复杂了,因为方法里面有执行代码,在未来会学习到。

最后则表示当前类的一些附加的属性:

因为JVM在编译时会增加一些特定的一些属性信息。

原文地址:https://www.cnblogs.com/webor2006/p/9457722.html

时间: 2024-10-28 00:47:57

Java字节码常量池深度剖析与字节码整体结构分解的相关文章

Java之hashCode与equals深度剖析与源码详解

1. 当向ArrayList添加一个对象时,实际上就是将该对象放置到了ArrayList底层所维护的数组当中:当向LinkedList中添加一个对象时,实际上LinkedList内部会生成一个Entry对象,该Entry对象的结构为: Entry { Entry previous; Object element; Entry next; } 其中的Object类型的元素element就是我们向LinkedList中所添加的元素,然后Entry又构造好了向前与向后的引用previous.next,

Android之线程池深度剖析

1.线程池的引入 引入的好处:  1)提升性能.创建和消耗对象费时费CPU资源  2)防止内存过度消耗.控制活动线程的数量,防止并发线程过多.  使用条件:     假设在一台服务器完成一项任务的时间为T     T1 创建线程的时间         T2 在线程中执行任务的时间,包括线程间同步所需时间         T3 线程销毁的时间          显然T = T1+T2+T3.注意这是一个极度简化的假设.     可以看出T1,T3是多线程本身的带来的开销,我们渴望减少T1,T3所用

日常总结の关于Java中的常量池技术

一.相关概念 什么是常量用final修饰的成员变量表示常量,值一旦给定就无法改变!final修饰的变量有三种:静态变量.实例变量和局部变量,分别表示三种类型的常量. Class文件中的常量池 简单讲解一下class文件的结构,开头的4个字节是class文件魔数,用来标识这是一个class文件,说白话点就是文件头,既:CA FE BA BE. 紧接着4个字节是java的版本号,这里的版本号是34,因为笔者是用jdk8编译的,版本号的高低和jdk版本的高低相对应,高版本可以兼容低版本,但低版本无法执

Java设计模式-代理模式之动态代理(附源码分析)

Java设计模式-代理模式之动态代理(附源码分析) 动态代理概念及类图 上一篇中介绍了静态代理,动态代理跟静态代理一个最大的区别就是:动态代理是在运行时刻动态的创建出代理类及其对象.上篇中的静态代理是在编译的时候就确定了代理类具体类型,如果有多个类需要代理,那么就得创建多个.还有一点,如果Subject中新增了一个方法,那么对应的实现接口的类中也要相应的实习该方法,不符合设计模式原则. 动态代理的做法:在运行时刻,可以动态创建出一个实现了多个接口的代理类.每个代理类的对象都会关联一个表示内部处理

Java中的常量和常量的表现形式及进制的转换

1.常量 在程序执行的过程中,其值不发生改变的量. 分类: (1) 字面值常量 字符串常量:用双引号括起来内容 字符常量:用单引号括起来的内容 整数常量:所有整数 小数常量:所有小数 布尔常量:true 或 false 空常量: null (2) 自定义常量(符号常量) 用final修饰变量(也就是常量) 2.常量的表现形式 Java针对整数常量提供了4种表现形式: 二进制 八进制 十进制 十六进制 3.进制的概述: 进制就是进位制,是人们规定的一种进位方法.几进制就是逢几进一. 计算机的电子原

zg手册 之 python2.7.7源码分析(4)-- pyc字节码文件

什么是字节码 python解释器在执行python脚本文件时,对文件中的python源代码进行编译,编译的结果就是byte code(字节码) python虚拟机执行编译好的字节码,完成程序的运行 python会为导入的模块创建字节码文件 字节码文件的创建过程 当a.py依赖b.py时,如在a.py中import b python先检查是否有b.pyc文件(字节码文件),如果有,并且修改时间比b.py晚,就直接调用b.pyc 否则编译b.py生成b.pyc,然后加载新生成的字节码文件 字节码对象

java io系列03之 ByteArrayOutputStream的简介,源码分析和示例(包括OutputStream)

前面学习ByteArrayInputStream,了解了“输入流”.接下来,我们学习与ByteArrayInputStream相对应的输出流,即ByteArrayOutputStream.本章,我们会先对ByteArrayOutputStream进行介绍,在了解了它的源码之后,再通过示例来掌握如何使用它. 转载请注明出处:http://www.cnblogs.com/skywang12345/p/io_03.html ByteArrayOutputStream 介绍 ByteArrayOutpu

java io系列02之 ByteArrayInputStream的简介,源码分析和示例(包括InputStream)

我们以ByteArrayInputStream,拉开对字节类型的“输入流”的学习序幕.本章,我们会先对ByteArrayInputStream进行介绍,然后深入了解一下它的源码,最后通过示例来掌握它的用法. 转载请注明出处:http://www.cnblogs.com/skywang12345/p/io_02.html ByteArrayInputStream 介绍 ByteArrayInputStream 是字节数组输入流.它继承于InputStream.它包含一个内部缓冲区,该缓冲区包含从流

Java面试准备之String类专项突破+源码分析

String的源码中有很多Arrays的方法使用,建议先参阅Arrays的类库 基本介绍: String是一个比较特殊的类,有很多种建立的方法. 如果使用传统的构造方法比如 String s = new String("字符串");这时的对象会在堆上分配,这时候比较两个字符串地址就不相等,而用""双引号包起来的内容会在常量池中做停留,这时如果有两个内容一样的地址就一样了. 因此,使用==来比较字符串是不靠谱的. String类还实现了三个接口:Serializabl