Java深度理解——Java字节代码的操纵

导读:Java作为业界应用最为广泛的语言之一,深得众多软件厂商和开发者的推崇,更是被包括Oracle在内的众多JCP成员积极地推动发展。但是对于 
Java语言的深度理解和运用,毕竟是很少会有人涉及的话题。InfoQ中文站特地邀请IBM高级工程师成富为大家撰写这个《Java深度历险》专栏,旨在就Java的一些深度和高级特性分享他的经验。
在一般的Java应用开发过程中,开发人员使用Java的方式比较简单。打开惯用的IDE,编写Java源代码,再利用IDE提供的功能直接运行 
Java 
程序就可以了。这种开发模式背后的过程是:开发人员编写的是Java源代码文件(.java),IDE会负责调用Java的编译器把Java源代码编译成平台无关的字节代码(byte 
code),以类文件的形式保存在磁盘上(.class)。Java虚拟机(JVM)会负责把Java字节代码加载并执行。Java通过这种方式来实现其 
“编写一次,到处运行(Write once, run anywhere)” 
的目标。Java类文件中包含的字节代码可以被不同平台上的JVM所使用。Java字节代码不仅可以以文件形式存在于磁盘上,也可以通过网络方式来下载,还可以只存在于内存中。JVM中的类加载器会负责从包含字节代码的字节数组(byte[])中定义出Java类。在某些情况下,可能会需要动态的生成 
Java字节代码,或是对已有的Java字节代码进行修改。这个时候就需要用到本文中将要介绍的相关技术。首先介绍一下如何动态编译Java源文件。
动态编译Java源文件
在一般情况下,开发人员都是在程序运行之前就编写完成了全部的Java源代码并且成功编译。对有些应用来说,Java源代码的内容在运行时刻才能确定。这个时候就需要动态编译源代码来生成Java字节代码,再由JVM来加载执行。典型的场景是很多算法竞赛的在线评测系统(如PKU 
JudgeOnline),允许用户上传Java代码,由系统在后台编译、运行并进行判定。在动态编译Java源文件时,使用的做法是直接在程序中调用Java编译器。
?JSR javascript特效
199引入了Java编译器API。如果使用JDK 6的话,可以通过此API来动态编译Java代码。比如下面的代码用来动态编译最简单的Hello 
World类。该Java类的代码是保存在一个字符串中的。
public class 
CompilerTest {
   public 
static void main(String[] args) throws Exception {    
      String http://www.huiyi8.com/jiaoben/?
source = "public class Main { public static void main(String[] args) 
{System.out.println(\"Hello World!\");} }";
JavaCompiler compiler = ToolProvider.getSystemJavaCompiler();     
StandardJavaFileManager fileManager = compiler.getStandardFileManager(null, 
null, null);
     
StringSourceJavaObject sourceObject = new 
CompilerTest.StringSourceJavaObject("Main", source);
     
Iterable< extends JavaFileObject> fileObjects = 
Arrays.asList(sourceObject);
     
CompilationTask task = compiler.getTask(null, fileManager, null, null, null, 
fileObjects);
      boolean 
result = task.call();
      if 
(result) {
        
System.out.println("编译成功。");
      }
   }
   static class 
StringSourceJavaObject extends SimpleJavaFileObject {
      private 
String content = null;
      public 
StringSourceJavaObject(String name, String content) ??throws URISyntaxException 
{        
super(URI.create("string:///" + name.replace(‘.‘,‘/‘) + Kind.SOURCE.extension), 
Kind.SOURCE);
        
this.content = content;
     }
      public 
CharSequence getCharContent(boolean ignoreEncodingErrors) ??throws IOException 
{
         return 
content;
      }
   }
}
如果不能使用JDK 
6提供的Java编译器API的话,可以使用JDK中的工具类com.sun.tools.javac.Main,不过该工具类只能编译存放在磁盘上的文件,类似于直接使用javac命令。
另外一个可用的工具是Eclipse 
JDT Core提供的编译器。这是Eclipse 
Java开发环境使用的增量式Java编译器,支持运行和调试有错误的代码。该编译器也可以单独使用。Play框架在内部使用了JDT的编译器来动态编译Java源代码。在开发模式下,Play框架会定期扫描项目中的Java源代码文件,一旦发现有修改,会自动编译 
Java源代码。因此在修改代码之后,刷新页面就可以看到变化。使用这些动态编译的方式的时候,需要确保JDK中的tools.jar在应用的 
CLASSPATH中。
下面介绍一个例子,是关于如何在Java里面做四则运算,比如求出来(3+4)*7-10的值。一般的做法是分析输入的运算表达式,自己来模拟计算过程。考虑到括号的存在和运算符的优先级等问题,这样的计算过程会比较复杂,而且容易出错。另外一种做法是可以用JSR
223引入的脚本语言支持,直接把输入的表达式当做Javascript或是JavaFX脚本来执行,得到结果。下面的代码使用的做法是动态生成Java源代码并编译,接着加载Java类来执行并获取结果。这种做法完全使用Java来实现。
private static 
double calculate(String expr) throws CalculationException  {
   String 
className = "CalculatorMain";
   String 
methodName = "calculate";
   String 
source = "public class " + className
      + " { 
public static double " + methodName + "() { return " + expr + "; } }";
     
//省略动态编译Java源代码的相关代码,参见上一节
   boolean 
result = task.call();
   if (result) 
{
     
ClassLoader loader = Calculator.class.getClassLoader();
      try 
{          
        
Class<?> clazz = loader.loadClass(className);
         Method 
method = clazz.getMethod(methodName, new Class<?>[] {});
         Object 
value = method.invoke(null, new Object[] {});
         return 
(Double) value;
      } catch 
(Exception e) {
         throw 
new CalculationException("内部错误。");      
      }  
   } else {
      throw new 
CalculationException("错误的表达式。");  
   }
}
上面的代码给出了使用动态生成的Java字节代码的基本模式,即通过类加载器来加载字节代码,创建Java类的对象的实例,再通过Java反射API来调用对象中的方法。
Java字节代码增强
Java 
字节代码增强指的是在Java字节代码生成之后,对其进行修改,增强其功能。这种做法相当于对应用程序的二进制文件进行修改。在很多Java框架中都可以见到这种实现方式。Java字节代码增强通常与Java源文件中的注解(annotation)一块使用。注解在Java源代码中声明了需要增强的行为及相关的元数据,由框架在运行时刻完成对字节代码的增强。Java字节代码增强应用的场景比较多,一般都集中在减少冗余代码和对开发人员屏蔽底层的实现细节上。用过JavaBeans的人可能对其中那些必须添加的getter/setter方法感到很繁琐,并且难以维护。而通过字节代码增强,开发人员只需要声明Bean中的属性即可,getter/setter方法可以通过修改字节代码来自动添加。用过JPA的人,在调试程序的时候,会发现实体类中被添加了一些额外的 
域和方法。这些域和方法是在运行时刻由JPA的实现动态添加的。字节代码增强在面向方面编程(AOP)的一些实现中也有使用。
在讨论如何进行字节代码增强之前,首先介绍一下表示一个Java类或接口的字节代码的组织形式。
类文件 {
  
0xCAFEBABE,小版本号,大版本号,常量池大小,常量池数组,
  
访问控制标记,当前类信息,父类信息,实现的接口个数,实现的接口信息数组,域个数,
   
域信息数组,方法个数,方法信息数组,属性个数,属性信息数组

}
如上所示,一个类或接口的字节代码使用的是一种松散的组织结构,其中所包含的内容依次排列。对于可能包含多个条目的内容,如所实现的接口、域、方法和属性等,是以数组来表示的。而在数组之前的是该数组中条目的个数。不同的内容类型,有其不同的内部结构。对于开发人员来说,直接操纵包含字节代码的字节数组的话,开发效率比较低,而且容易出错。已经有不少的开源库可以对字节代码进行修改或是从头开始创建新的Java类的字节代码内容。这些类库包括ASM、cglib、serp和BCEL等。使用这些类库可以在一定程度上降低增强字节代码的复杂度。比如考虑下面一个简单的需求,在一个Java类的所有方法执行之前输出相应的日志。熟悉AOP的人都知道,可以用一个前增强(before 
advice)来解决这个问题。如果使用ASM的话,相关的代码如下:
ClassReader cr 
= new ClassReader(is);
ClassNode cn = 
new ClassNode();
cr.accept(cn, 
0);
for (Object 
object : cn.methods) {  
   MethodNode 
mn = (MethodNode) object; 
   if 
("<init>".equals(mn.name) || "<clinit>".equals(mn.name)) 
{      
     
continue;  
   }  
   InsnList 
insns = mn.instructions;  
   InsnList il 
= new InsnList(); 
   il.add(new 
FieldInsnNode(GETSTATIC, "java/lang/System", "out", 
"Ljava/io/PrintStream;"));  
   il.add(new 
LdcInsnNode("Enter method -> " + mn.name)); 
   il.add(new 
MethodInsnNode(INVOKEVIRTUAL, "java/io/PrintStream", "println", 
"(Ljava/lang/String;)V"));  
  
insns.insert(il);  mn.maxStack += 3;
}
ClassWriter cw 
= new ClassWriter(0);
cn.accept(cw);
byte[] b = 
cw.toByteArray();
从ClassWriter就可以获取到包含增强之后的字节代码的字节数组,可以把字节代码写回磁盘或是由类加载器直接使用。上述示例中,增强部分的逻辑比较简单,只是遍历Java类中的所有方法并添加对System.out.println方法的调用。在字节代码中,Java方法体是由一系列的指令组成的。而要做的是生成调用 
System.out.println方法的指令,并把这些指令插入到指令集合的最前面。ASM对这些指令做了抽象,不过熟悉全部的指令比较困难。ASM 
提供了一个工具类ASMifierClassVisitor,可以打印出Java类的字节代码的结构信息。当需要增强某个类的时候,可以先在源代码上做出修改,再通过此工具类来比较修改前后的字节代码的差异,从而确定该如何编写增强的代码。
对类文件进行增强的时机是需要在Java源代码编译之后,在JVM执行之前。比较常见的做法有:
由IDE在完成编译操作之后执行。如Google 
App Engine的Eclipse插件会在编译之后运行DataNucleus来对实体类进行增强。
在构建过程中完成,比如通过Ant或Maven来执行相关的操作。
实现自己的Java类加载器。当获取到Java类的字节代码之后,先进行增强处理,再从修改过的字节代码中定义出Java类。
通过JDK 
5引入的java.lang.instrument包来完成。
java.lang.instrument
由于存在着大量对Java字节代码进行修改的需求,JDK 
5引入了java.lang.instrument包并在JDK 
6中得到了进一步的增强。基本的思路是在JVM启动的时候添加一些代理(agent)。每个代理是一个jar包,其清单(manifest)文件中会指定一个代理类。这个类会包含一个premain方法。JVM在启动的时候会首先执行代理类的premain方法,再执行Java程序本身的main方法。在 
premain方法中就可以对程序本身的字节代码进行修改。JDK 
6中还允许在JVM启动之后动态添加代理。java.lang.instrument包支持两种修改的场景,一种是重定义一个Java类,即完全替换一个 
Java类的字节代码;另外一种是转换已有的Java类,相当于前面提到的类字节代码增强。还是以前面提到的输出方法执行日志的场景为例,首先需要实现java.lang.instrument.ClassFileTransformer接口来完成对已有Java类的转换。
static class 
MethodEntryTransformer implements ClassFileTransformer {
   public 
byte[] transform(ClassLoader loader, String className,
    
Class<?> classBeingRedefined, ?ProtectionDomain protectionDomain, byte[] 
classfileBuffer)
     throws  
IllegalClassFormatException {
        try 
{
          
ClassReader cr = new ClassReader(classfileBuffer);
          
ClassNode cn = new ClassNode();          
          
//省略使用ASM进行字节代码转换的代码          
          
ClassWriter cw = new ClassWriter(0);
          
cn.accept(cw);
          
return cw.toByteArray();     
        } catch 
(Exception e){          
          
return null;
        }
   }
}
有了这个转换类之后,就可以在代理的premain方法中使用它。
public static 
void premain(String args, Instrumentation inst) {  
  
inst.addTransformer(new MethodEntryTransformer());
}
把该代理类打成一个jar包,并在jar包的清单文件中通过Premain-Class声明代理类的名称。运行Java程序的时候,添加JVM启动参数-javaagent:myagent.jar。这样的话,JVM会在加载Java类的字节代码之前,完成相关的转换操作。
总结
操纵Java字节代码是一件很有趣的事情。通过它,可以很容易的对二进制分发的Java程序进行修改,非常适合于性能分析、调试跟踪和日志记录等任务。另外一个非常重要的作用是把开发人员从繁琐的Java语法中解放出来。开发人员应该只需要负责编写与业务逻辑相关的重要代码。对于那些只是因为语法要求而添加的,或是模式固定的代码,完全可以将其字节代码动态生成出来。字节代码增强和源代码生成是不同的概念。源代码生成之后,就已经成为了程序的一部分,开发人员需要去维护它:要么手工修改生成出来的源代码,要么重新生成。而字节代码的增强过程,对于开发人员是完全透明的。妥善使用Java字节代码的操纵技术,可以更好的解决某一类开发问题。

Java深度理解——Java字节代码的操纵

时间: 2024-12-04 11:42:44

Java深度理解——Java字节代码的操纵的相关文章

深度理解java虚拟机读书笔记(二)HotSpot Java对象创建,内存布局以及访问方式

内存中对象的创建.对象的结构以及访问方式. 一.对象的创建 在语言层面上,对象的创建只不过是一个new关键字而已,那么在虚拟机中又是一个怎样的过程呢? (一)判断类是否加载.虚拟机遇到一条new指令的时候,首先会检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号代表的类是否被加载.解析并初始化.如果没有完成这个过程,则必须执行相应类的加载. (二)在堆上为对象分配空间.对象需要的空间大小在类加载完成后便能确定.之后便是在堆上为该对象分配固定大小的空间.分配的方式也有两种:

java笔记--理解java类加载器以及ClassLoader类

类加载器概述: java类的加载是由虚拟机来完成的,虚拟机把描述类的Class文件加载到内存,并对数据进行校验,解析和初始化,最终形成能被java虚拟机直接使用的java类型,这就是虚拟机的类加载机制.JVM中用来完成上述功能的具体实现就是类加载器.类加载器读取.class字节码文件将其转换成java.lang.Class类的一个实例.每个实例用来表示一个java类.通过该实例的newInstance()方法可以创建出一个该类的对象. 类的生命周期: 类从加载到虚拟机内存到被从内存中释放,经历的

【java】理解java对象序列化

关于Java序列化的文章早已是汗牛充栋了,本文是对我个人过往学习,理解及应用Java序列化的一个总结.此文内容涉及Java序列化的基本原理,以及多种方法对序列化形式进行定制.在撰写本文时,既参考了Thinking in Java, Effective Java,JavaWorld,developerWorks中的相关文章和其它网络资料,也加入了自己的实践经验与理解,文.码并茂,希望对大家有所帮助.(2012.02.14最后更新) 1. 什么是Java对象序列化 Java平台允许我们在内存中创建可

Java多态性理解

Java多态性理解 Java中多态性的实现 什么是多态 面向对象的三大特性:封装.继承.多态.从一定角度来看,封装和继承几乎都是为多态而准备的.这是我们最后一个概念,也是最重要的知识点. 多态的定义:指允许不同类的对象对同一消息做出响应.即同一消息可以根据发送对象的不同而采用多种不同的行为方式.(发送消息就是函数调用) 实现多态的技术称为:动态绑定(dynamic binding),是指在执行期间判断所引用对象的实际类型,根据其实际的类型调用其相应的方法. 多态的作用:消除类型之间的耦合关系.

深入理解 Java 枚举

目录   1. 简介  2. 枚举的本质  3. 枚举的方法  4. 枚举的特性  5. 枚举的应用  6. 枚举工具类  7. 小结  8. 参考资料 ?? 本文已归档到:「javacore」 ?? 本文中的示例代码已归档到:「javacore」 1. 简介 enum 的全称为 enumeration, 是 JDK5 中引入的特性. 在 Java 中,被 enum 关键字修饰的类型就是枚举类型.形式如下: enum ColorEn { RED, GREEN, BLUE } 枚举的好处:可以将常

深入理解Java虚拟机(类文件结构+类加载机制+字节码执行引擎)

周志明的<深入理解Java虚拟机>很好很强大,阅读起来颇有点费劲,尤其是当你跟随作者的思路一直探究下去,开始会让你弄不清方向,难免有些你说的啥子的感觉.但知识不得不学,于是天天看,反复看,就慢慢的理解了.我其实不想说这种硬磨的方法有多好,我甚至不推荐,我建议大家阅读这本书时,由浅入深,有舍有得,先从宏观去理解去阅读,再慢慢深入,有条不紊的看下去.具体来说,当你看书的某一部分时,先看这部分的章节名,了解这部分这一章在讲什么,然后再看某一章,我拿"类文件结构"这一章来说,我必须

Java面向对象的理解和实现代码

理解Java面向对象的重要知识点: 一. 类,对象 类?首先举一个例子:小李设计了一张汽车设计图,然后交给生产车间来生产汽车,有黑色的.红色的.白色的... 这里,汽车设计图就是我们说的类(class),生产车间就是new构造器(大部分对象都是new出来的),生产出来的汽车就是我们要说的对象.可以说java编程实质就是构建类的过程. 对象?万物皆对象,宇宙中,如植物,动物,人类,每个个体都是各司其职.各尽所能的.这就要求对象高内聚.低耦合(简单理解就是人的大脑,它负责思考,想象,记忆,而不能呼吸

深入理解Java中的同步静态方法和synchronized(class)代码块的类锁

一.回顾学习内容 在前面几篇博客中我我们已经理解了synchronized对象锁.对象锁的重入.synchronized方法块.synchronized非本对象的代码块, 链接:https://www.cnblogs.com/SAM-CJM/category/1314992.html 我们来总结一下,上面几篇讲到内容: 1.创建线程类的两个方式:继承Thread类和实现Runable接口. 2.了解了Thread类的几个基本构造器. 3.启动多线程时要使用start方法,不要直接调用run方法.

《深入理解Java虚拟机:JVM高级属性与最佳实践》读书笔记(更新中)

第一章:走进Java 概述 Java技术体系 Java发展史 Java虚拟机发展史 1996年 JDK1.0,出现Sun Classic VM HotSpot VM, 它是 Sun JDK 和 OpenJDK 中所带的虚拟机,最初并不是Sun开发 Sun Mobile- Embedded VM/ Meta- Circular VM BEA JRockit/ IBM J9 VM JRockit曾号称世界上最快的java虚拟机,BEA公司发布.J9属于IBM主要扶持的虚拟机 Azul VM/ BEA