Java字节码 小结

Reference


字节码 核心概念

Class文件是8位字节流,按字节对齐。之所以称为字节码,是由于每条指令都仅仅占领一个字节。全部的操作码和操作数都是按字节对齐的。

数据结构

Java虚拟机规范中规定。Class文件格式採用一种相似C语言结构体的伪结构来存储,它仅仅有两种数据类型

无符号数(基本数据类型)

主要用于描写叙述数字、索引引用、数量值、或UTF-8编码构成的字符串;

u1 – 1个字节

u2 – 2个字节

u4 – 4个字节

u8 – 8个字节

表(复合数据类型)

用于描写叙述有层次关系的复合结构的数据。

习惯性以“_info”结尾

Class文件格式

数据类型 名称 数量
u4 magic 1
u2 minor_version 1
u2 major_version 1
u2 constant_pool_count 1
cp_info constant_pool constant_pool_count + 1
u2 access_flags 1
u2 this_class 1
u2 super_class 1
u2 interfaces_count 1
u2 interfaces interfaces_count
u2 fields_count 1
field_info fields fields_count
u2 methods_count 1
method_info methods methods_count
u2 attributes_count 1
attribute_info attributes attributes_count

class说明

  • magic: Class文件的头4个字节,它的唯一作用是用于确认该文件是否是能被JVM接受的Class文件
  • minor_version :第5和第6字节是次版本号号
  • major_version:第7和第8字节是主版本号号

  • constant_pool_count: 常量池大小
  • cp_info : 复合数据结构,是一组常量数据结构,有11种常量数据结构

  • access_flags :訪问标志,access_flags的计算公式为:access_flags = flagA | flagB | flagB …

  • field_info :字段表(field_info)用于描写叙述类或接口中声明的变量,它包括类变量、实例变量,但不包括方法内的局部变量和块变量。和cp_info部分不一样。cp_info由于常量类型的不一样其数据结构有11种,但field_info的结构仅仅有一种。

    (数据结构例如以下)

    字段訪问标志。和类的訪问标志,由于修饰符不同稍有不同,具体见下图。

  • method_info:方法表集合(method_info)和字段表集合的结构是一致的,仅仅是訪问标志不同。

  • attribute_info:用于在Class文件、字段表、方法表中携带自己的属性表集合,以用于描写叙述某些场景的专有信息。

    Java程序方法体里面的代码经过javac编译器处理过后将终于字节码存储在Code属性内。抽象类或接口中的方法不存在Code属性。

  • SourceFile:SourceFile属性主要记录生成这个Class文件的源码名称,也属于可选属性,能够使用javac的-g:none或-g:source选项来关闭或要求生成这些信息。
  • LocalVariableTable:LocalVariableTable属性用于描写叙述栈帧中局部变量表中的变量与Java源码定义的变量之间的关系,可是这样的关系并不是执行时必须,默认也不会生成到Class文件里,能够通过javac中使用-g:none或-g:vars选项取消或者生成这项信息。
  • LineNumberTable:LineNumberTable属性用于描写叙述Java源码行号和字节码行号(字节码的偏移量)之间的相应关系,它不是执行时必须属性。但默认会生成到Class文件里。

    也能够在javac中使用-g:none或-g:lines选项来取消或显示生成这一部分信息。

具体參见 Java字节码.class文件案例分析


jvm执行浅谈

Java虚拟机(JVM)是基于栈结构的。对于最初的main方法产生的全部的方法调用,都会在栈中产生一个帧。这些帧各自包括一组局部变量,这组局部变量就是这种方法在执行过程中所需的全部变量,包括一个指向this的引用、该方法的全部參数以及其它局部定义的变量。对于类方法(即static方法),其參数列表从0開始算起。而对于实例方法。位置0是用来存储this引用。

class执行就是jvm顺序执行一条条保存在Code中的指令,例如以下所看到的:

动态过程,例如以下:

public class Demo {
    public static void foo() {
       int a = 1;
       int b = 2;
       int c = (a + b) * 5;
    }
}

具体參见

- 深入理解java字节码

- 从Java代码到字节码


javap 反汇编

javap是JDK自带的反汇编器。能够查看java编译器为我们生成的字节码。通过它,我们能够对比源码和字节码。从而了解非常多编译器内部的工作。

语法:

  javap [ 命令选项 ] class…

  javap 命令用于解析类文件。其输出取决于所用的选项。

若没有使用选项。javap 将输出传递给它的类的 public 域及方法。javap 将其输出到标准输出设备上。

命令选项

  -help 输出 javap 的帮助信息。

  -l 输出行及局部变量表。

  -public 仅仅显示 public 类及成员。

  -protected 仅仅显示 protected 和 public 类及成员。

  -package 仅仅显示包、protected 和 public 类及成员。这是缺省设置。

  -private 显示全部类和成员。

  -s 输出内部类型签名。

  -c 输出类中各方法的未解析的代码。即构成 Java 字节码的指令。

  -verbose 输出堆栈大小、各方法的 locals 及 args 数,以及class文件的编译版本号

  -classpath[路径] 指定 javap 用来查找类的路径。假设设置了该选项,则它将覆盖缺省值或 CLASSPATH 环境变量。文件夹用冒号分隔。

  -bootclasspath[路径] 指定载入自举类所用的路径。

缺省情况下,自举类是实现核心 Java 平台的类。位于 jrelib以下。

  -extdirs[dirs] 覆盖搜索安装方式扩展的位置。

扩展的缺省位置是 jrelibext。

时间: 2024-08-24 02:33:30

Java字节码 小结的相关文章

关于java字节码框架ASM的学习

一.什么是ASM ASM是一个java字节码操纵框架,它能被用来动态生成类或者增强既有类的功能.ASM 可以直接产生二进制 class 文件,也可以在类被加载入 Java 虚拟机之前动态改变类行为.Java class 被存储在严格格式定义的 .class文件里,这些类文件拥有足够的元数据来解析类中的所有元素:类名称.方法.属性以及 Java 字节码(指令).ASM从类文件中读入信息后,能够改变类行为,分析类信息,甚至能够根据用户要求生成新类.asm字节码增强技术主要是用来反射的时候提升性能的,

从零写一个编译器(十一):代码生成之Java字节码基础

项目的完整代码在 C2j-Compiler 前言 第十一篇,终于要进入代码生成部分了,但是但是在此之前,因为我们要做的是C语言到字节码的编译,所以自然要了解一些字节码,但是由于C语言比较简单,所以只需要了解一些字节码基础 JVM的基本机制 JVM有一个执行环境叫做stack frame 这个环境有两个基本数据结构 执行堆栈:指令的执行,都会围绕这个堆栈来进行 局部变量数组,参数和局部变量就存储在这个数组. 还有一个PC指针,它指向下一条要执行的指令. 举一个例子 int f(int a, int

java字节码忍者禁术

Java语言本身是由Java语言规格说明(JLS)所定义的,而Java虚拟机的可执行字节码则是由一个完全独立的标准,即Java虚拟机规格说明(通常也被称为VMSpec)所定义的. JVM字节码是通过javac对Java源代码文件进行编译后生成的,生成的字节码与原本的Java语言存在着很大的不同.比方说,在Java语言中为人熟知的一些高级特性,在编译过程中会被移除,在字节码中完全不见踪影. 这方面最明显的一个例子莫过于Java中的各种循环关键字了(for.while等等),这些关键字在编译过程中会

通过Java字节码发现有趣的内幕之String篇(上)(转)

原文出处: jaffa 很多时候我们在编写Java代码时,判断和猜测代码问题时主要是通过运行结果来得到答案,本博文主要是想通过Java字节码的方式来进一步求证我们已知的东西.这里没有对Java字节码知识进行介绍,如果想了解更多的Java字节码或对其感兴趣的朋友可以先阅读字节码基础:JVM字节码初探. String字面量可以通过’==’判断两个字符串是否相同,是因为大家都知道’==’是用来判断两个对象的值引用地址是否一致,两个值一样的字符串字面量定义是否指向同一个值内存地址呢?答案是肯定的. 1

如何调教java字节码

本文地址:http://www.cnblogs.com/herbix/p/3541093.html java字节码是直接在在jvm上运行的代码.和简单易懂的java程序不同,java字节码是类似于汇编的指令串,不过比汇编的指令集要小很多,java字节码可优化的余地没有那么大,想直接编写字节码也要比编写汇编容易许多. <JAVA虚拟机规范 java SE 7>这本书上详细介绍了制作一个java虚拟机的过程,包括类文件的结构.指令集.还有一些约束等等,其余的部分是由虚拟机的编写者决定的.既然我们的

JAVA字节码修改异常分析

源class反编译后代码如下: public boolean isExpiring() { if ((this.timestamp == null) || (this.timestamp.length() <= 0)) { return true; } boolean isExpiring = false; try { SimpleDateFormat df = new SimpleDateFormat( SSOAuthConfig.getAuthDataDateFormart()); Date

Java字节码基础[转]

原文链接:http://it.deepinmind.com/jvm/2014/05/24/mastering-java-bytecode.html Java是一门设计为运行于虚拟机之上的编程语言,因此它需要一次编译,处处运行(当然也是一次编写,处处测试).因此,安装到你系统上的JVM是原生的程序,而运行在它之上的代码是平台无关的.Java字节码就是你写的源代码的中间表现形式,也就是你的代码编译后的产物.你的class文件就是字节码. 简单点说,字节码就是JVM使用的代码集,它在运行时可能会被JI

JAVA字节码解析

Java字节码指令 Java 字节码指令及javap 使用说明 ### java字节码指令列表 字节码 助记符 指令含义 0x00 nop 什么都不做 0x01 aconst_null 将null推送至栈顶 0x02 iconst_m1 将int型-1推送至栈顶 0x03 iconst_0 将int型0推送至栈顶 0x04 iconst_1 将int型1推送至栈顶 0x05 iconst_2 将int型2推送至栈顶 0x06 iconst_3 将int型3推送至栈顶 0x07 iconst_4

【转】在Eclipse里查看Java字节码

要理解 Java 字节码,比较推荐的方法是自己尝试编写源码对照字节码学习.其中阅读 Java 字节码的工具必不可少.虽然javap可以以可读的形式展示出.class 文件中字节码,但每次改动源码都需调用命令行并不方便.这里介绍一个可以辅助阅读 Java 字节码的 Eclipse 插件:bytecode outline. bytecode outline 插件用可读的方式展现了 Eclipse 的 Java 编辑器或类文件的字节码内容.它使用了 ASM 框 架的部分组建来实现对字节码的展示(ASM