从1+1=2来理解Java字节码从1+1=2来理解Java字节码

编译“1+1”代码

首先我们需要写个简单的小程序,1+1的程序,学习就要从最简单的1+1开始,代码如下:

写好java类文件后,首先执行命令javac TestJava.java 编译类文件,生成TestJava.class。 然后执行反编译命令javap -verbose TestJava,字节码结果显示如下:

Compiled from "TestJava.java"

public class top.luozhou.test.TestJava

minor version: 0

major version: 56

flags: ACC_PUBLIC, ACC_SUPER

Constant pool:

#1 = Methodref #5.#14 // java/lang/Object."<init>":()V

#2 = Fieldref #15.#16 // java/lang/System.out:Ljava/io/PrintStream;

#3 = Methodref #17.#18 // java/io/PrintStream.println:(I)V

#4 = Class #19 // top/luozhou/test/TestJava

#5 = Class #20 // java/lang/Object

#6 = Utf8 <init>

#7 = Utf8 ()V

#8 = Utf8 Code

#9 = Utf8 LineNumberTable

#10 = Utf8 main

#11 = Utf8 ([Ljava/lang/String;)V

#12 = Utf8 SourceFile

#13 = Utf8 TestJava.java

#14 = NameAndType #6:#7 // "<init>":()V

#15 = Class #21 // java/lang/System

#16 = NameAndType #22:#23 // out:Ljava/io/PrintStream;

#17 = Class #24 // java/io/PrintStream

#18 = NameAndType #25:#26 // println:(I)V

#19 = Utf8 top/luozhou/test/TestJava

#20 = Utf8 java/lang/Object

#21 = Utf8 java/lang/System

#22 = Utf8 out

#23 = Utf8 Ljava/io/PrintStream;

#24 = Utf8 java/io/PrintStream

#25 = Utf8 println

#26 = Utf8 (I)V

{

public top.luozhou.test.TestJava();

descriptor: ()V

flags: ACC_PUBLIC

Code:

stack=1, locals=1, args_size=1

0: aload_0

1: invokespecial #1 // Method java/lang/Object."<init>":()V

4: return

LineNumberTable:

line 8: 0

public static void main(java.lang.String[]);

descriptor: ([Ljava/lang/String;)V

flags: ACC_PUBLIC, ACC_STATIC

Code:

stack=2, locals=2, args_size=1

0: iconst_2

1: istore_1

2: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;

5: iload_1

6: invokevirtual #3 // Method java/io/PrintStream.println:(I)V

9: return

LineNumberTable:

line 10: 0

line 11: 2

line 12: 9

}

解析字节码

1.基础信息

上述结果删除了部分不影响解析的冗余信息,接下来我们便来解析字节码的结果。

minor version: 0 次版本号,为0表示未使用

major version: 56 主版本号,56表示jdk12,表示只能运行在jdk12版本以及之后的虚拟机中

flags: ACC_PUBLIC, ACC_SUPER

ACC_PUBLIC:这就是一个是否是public类型的访问标志。

ACC_SUPER: 这个falg是为了解决通过 invokespecial 指令调用 super 方法的问题。可以将它理解成 Java 1.0.2 的一个缺陷补丁,只有通过这样它才能正确找到 super 类方法。从 Java 1.0.2 开始,编译器始终会在字节码中生成 ACC_SUPER 访问标识。感兴趣的同学可以点击这里来了解更多。

2.常量池

接下来,我们将要分析常量池,你也可以对照上面整体的字节码来理解。

这是一个方法引用,这里的#5表示索引值,然后我们可以发现索引值为5的字节码如下

它表示这是一个Object类,同理#14指向的是一个"<init>":()V表示引用的是初始化方法。

上面这段表示是一个字段引用,同样引用了#15和#16,实际上引用的就是java/lang/System类中的PrintStream对象。其他的常量池分析思路是一样的,鉴于篇幅我就不一一说明了,只列下其中的几个关键类型和信息。

NameAndType:这个表示是名称和类型的常量表,可以指向方法名称或者字段的索引,在上面的字节码中都是表示的实际的方法。

Utf8:我们经常使用的是字符编码,但是这个不是只有字符编码的意思,它表示一种字符编码是Utf8的字符串。它是虚拟机中最常用的表结构,你可以理解为它可以描述方法,字段,类等信息。 比如:

这里表示#4这个索引下是一个类,然后指向的类是#19,#19是一个Utf8表,最终存放的是top/luozhou/test/TestJava,那么这样一连接起来就可以知道#4位置引用的类是top/luozhou/test/TestJava了。

3.构造方法信息

接下来,我们分析下构造方法的字节码,我们知道,一个类初始化的时候最先执行它的构造方法,如果你没有写构造方法,系统会默认给你添加一个无参的构造方法。

descriptor: ()V :表示这是一个没有返回值的方法。

flags: ACC_PUBLIC:是公共方法。

stack=1, locals=1, args_size=1 :表示栈中的数量为1,局部变量表中的变量为1,调用参数也为1。

这里为什么都是1呢?这不是默认的构造方法吗?哪来的参数?其实Java语言有一个潜规则:在任何实例方法里面都可以通过this来访问到此方法所属的对象。而这种机制的实现就是通过Java编译器在编译的时候作为入参传入到方法中了,熟悉python语言的同学肯定会知道,在python中定义一个方法总会传入一个self的参数,这也是传入此实例的引用到方法内部,Java只是把这种机制后推到编译阶段完成而已。所以,这里的1都是指this这个参数而已。

经过上面这个分析对于这个构造方法表达的意思也就很清晰了。

aload_0:表示把局部变量表中的第一个变量加载到栈中,也就是this。

invokespecial:直接调用初始化方法。

return:调用完毕方法结束。

LineNumberTable:这是一个行数的表,用来记录字节码的偏移量和代码行数的映射关系。line 8: 0表示,源码中第8行对应的就是偏移量0的字节码,因为是默认的构造方法,所以这里并无法直观体现出来。

另外这里会执行Object的构造方法是因为,Object是所有类的父类,子类的构造要先构造父类的构造方法。

4.main方法信息

有了之前构造方法的分析,我们接下来分析main方法也会熟悉很多,重复的我就略过了,这里重点分析code部分。

stack=2, locals=2, args_size=1:这里的栈和局部变量表为2,参数还是为1。这是为什么呢?因为main方法中声明了一个变量a,所以局部变量表要加一个,栈也是,所以他们是2。那为什么args_size还是1呢?你不是说默认会把this传入的吗?应该是2啊。注意:之前说的是在任何实例方法中,而这个main方法是一个静态方法,静态方法直接可以通过类+方法名访问,并不需要实例对象,所以这里就没必要传入了。

0: iconst_2:将int类型2推送到栈顶。

1: istore_1:将栈顶int类型数值存入第二个本地变量。

2: getstatic #2 // Field java/lang/System.out:Ljava/io/PrintStream;:获取PrintStream类。

5: iload_1: 把第二个int型本地变量推送到栈顶。

6: invokevirtual #3 // Method java/io/PrintStream.println:(I)V:调用println方法。这里的println方法就会把栈顶的元素作为自己的入参来执行,最终也会输出2。

9: return:调用完毕结束方法。

这里的LineNumberTable是有源码的,我们可以对照下我前面描述是否正确:

line 10: 0: 第10行表示0: iconst_2字节码,这里我们发现编译器直接给我们计算好了把2推送到栈顶了。

line 11: 2:第11行源码对应的是2: getstatic 获取输出的静态类PrintStream。

line 12: 9:12行源码对应的是return,表示方法结束。

这里我也画了一个动态图片来演示main方法执行的过程,希望能够帮助你理解:

总结

这篇文章我从1+1的的源码编译开始,分析了生成后的Java字节码,包括类的基本信息,常量池,方法调用过程等,通过这些分析,我们对Java字节码有了比较基本的了解,也知道了Java编译器会把优化手段通过编译好的字节码体现出来,比如我们的1+1=2,字节码字节赋值一个2给变量,而不是进行加法运算,从而优化了我们的代码,提搞了执行效率。

原文地址:https://www.cnblogs.com/CQqfjy/p/12294221.html

时间: 2024-10-15 12:20:06

从1+1=2来理解Java字节码从1+1=2来理解Java字节码的相关文章

《深入理解Java虚拟机》读书笔记——第1章 走近Java

(注:原文请见<深入理解Java虚拟机>周志明 著,知识点部分参考百度百科) 总述 第1章分为两个部分:Java概述及自己动手编译JDK的教程. 1 Java概述 介绍了Java的整体特性.Java的技术体系组成.Java及JVM的发展史. 1.1 Java的总体特性 1)Java不仅仅是一门编程语言,更是由一系列计算机软件和规范组成的技术体系. 2)Java具有众多优点: a.Java虚拟机在千差万别的物理机上建立了统一的运行平台,实现了跨平台性.(主要) b.提供了相对安全的内存管理和访问

java入门时的一些基本概念的理解(j2ee,j2se,j2me,jdk,sdk,jre,jvm,跨平台)

首先声明,这篇文章是从网上粘贴过来的.原文地址是:http://www.cnblogs.com/wangaohui/archive/2012/11/28/2791999.html.感觉写的很好,所以粘贴过来记录下. 这些日子,在看一些java的东西,由于刚入手,对java不是很了解,结果对java的一些名词没有一个清晰的脉络,现在稍微整理一下 令我纠结的是jdk,sdk,jre,jvm,ide,adt,跨平台性,j2ee,j2se,这些名词弄的我云里雾里的. 首先,什么是SDK呢? Softwa

java 字符流writer、reader基本操作及理解

字符和字节有什么区别,额--这个我也不知道. 1.基本操作实例 import java.io.*; public class CharDemo { public static void main(String[] args) { File f=new File("F:\\workspace\\Javaprj\\test.txt"); Writer out=null; Reader in=null; try { out=new FileWriter(f); String str=&quo

java学习笔记——Java中HashMap和TreeMap的区别深入理解

本文转载自Java中HashMap和TreeMap的区别深入理解 首先介绍一下什么是Map.在数组中我们是通过数组下标来对其内容索引的,而在Map中我们通过对象来对对象进行索引,用来索引的对象叫做key,其对应的对象叫做value.这就是我们平时说的键值对. HashMap通过hashcode对其内容进行快速查找,而 TreeMap中所有的元素都保持着某种固定的顺序,如果你需要得到一个有序的结果你就应该使用TreeMap(HashMap中元素的排列顺序是不固定的). HashMap 非线程安全 

java基础知识回顾之---java String final类普通方法的应用之“按照字节截取字符串”

/*需求:在java中,字符串“abcd”与字符串“ab你好”的长度是一样,都是四个字符.但对应的字节数不同,一个汉字占两个字节.定义一个方法,按照最大的字节数来取子串.如:对于“ab你好”,如果取三个字节,那么子串就是ab与“你”字的半个,那么半个就要舍弃.如果去四个字节就是“ab你”,取五个字节还是“ab你”.*/ 代码:其实是一个解码和编码的问题,要明白UTF-8码表和GBK码表的区别,UTF-8中用三个字节代表一个汉字,GBK使用2个字节代表一个汉字. 且在码表中都是用数字存放这些汉字.

Java多线程学习笔记——从Java JVM对多线程数据同步的一些理解

   我们知道在多线程编程中,我们很大的一部分内容是为了解决线程间的资源同步问题和线程间共同协作解决问题.线程间的同步,通俗我们理解为僧多粥少,在粥有限情况下,我们怎么去防止大家有秩序的喝到粥,不至于哄抢都没得喝.线程讲协作,我们可以理解为我们在医院看病的时候,我们要先挂号,才能看病.现在医院有很多病人排队,怎么协调病人都有秩序的先挂号,后看病.本篇文章的重点不在此,也不是在此一下子能分析完,我们先从Java JVM的角度来理解多线程的一些方面. 我们知道多线程间的数据同步,我们是通过加锁的操作

java同步包种ArrayBlockingQueue类的分析与理解

前言: ArrayBlockingQueue类是一个阻塞队列,重要用于多线程操作的条件. 一,官方解释 一个建立在数组之上被BlockingQueue绑定的阻塞队列.这个队列元素顺序是先进先出.队列的头部是在队列中待的时间最长的元素.队列的尾部是再队列中待的时间最短的元素.新的元素会被插入到队列尾部,并且队列从队列头部获取元素. 这是一个典型的绑定缓冲,在这个缓冲区中,有一个固定大小的数组持有生产者插入的数据,并且消费者会提取这些数据.一旦这个类被创建,那么这个数组的容量将不能再被改变.尝试使用

聊聊高并发(三十六)Java内存模型那些事(四)理解Happens-before规则

在前几篇将Java内存模型的那些事基本上把这个域底层的概念都解释清楚了,聊聊高并发(三十五)Java内存模型那些事(三)理解内存屏障 这篇分析了在X86平台下,volatile,synchronized, CAS操作都是基于Lock前缀的汇编指令来实现的,关于Lock指令有两个要点: 1. lock会锁总线,总线是互斥的,所以lock后面的写操作会写入缓存和内存,可以理解为在lock后面的写缓存和写内存这两个动作称为了一个原子操作.当总线被锁时,其他的CPU是无法使用总线的,也就让其他的读写都等

Java 同步与异步-阻塞与非阻塞理解

Java 同步与异步-阻塞与非阻塞理解 Java 中同步与异步,阻塞与非阻塞都是用来形容交互方式,区别在于它们描述的是交互的两个不同层面. 同步与异步 同步与异步更关注交互双方是否可以同时工作.以同步的方式完成任务意味着多个任务的完成次序是串行的,假设任务 A 依赖于任务 B,那么任务 A 必须等到任务 B 完成之后才能继续,执行流程为 A->B:以异步的方式完成任务意味着多个任务的完成可以是并行的,这种情况多适用于任务之间没有因果关系,假如任务 A 中需要执行任务 B,而任务 A 的完成不依赖