javac 编译器原理

  1. Javac 是什么

javac 是一种编译器,能讲一种语言规范转化成另外一种语言规范。如C,C++都是将源码直接编译成目标机器码,这个目标机器码是CPU直接执行的指令集合。

这些指令集合也就是底层的一种语言规范,机器能够直接识别这种语言规范,但是人不可能直接去写目标机器码。

从某种意义来说,有了编译器才有了程序语言的繁荣,因为编译器是人类和机器沟通的一个纽带。javac 的编译器也是将JAVA 这种对人非常友好的编程语言编译成对所有机器都非常友好的语言。

javac 的任务就是将Java源码编译成Java字节码,也就是JVM能够识别的二进制码。从表面上看就是将.java文件转成.class文件,实际上是将Java的源码转化成二进制数字。

2. javac 基本结构

源码——词法分析器——Token流——语法分析器——语法树——语义分析器——注解语法树——代码生成器——字节码

1)词法分析

读取源代码,一个字节一个字节地读进来,找到这些字节中哪些是定义的语法关键词,如Java中的if、else、for、while等关键词,要识别哪些if是合法的关键词、哪些不是。

从源码中找到一些规范化的Token流,就像人类语言中,给你一句话要能分辨出哪些是一个词语、哪些是标点符号、哪些是动词、哪些是名词等。

Scanner负责具体读取和归类不同词法的操作,判断哪些字符组合是一个Token。JavacParser规定了哪些词是符合Java语言规范规定的词:package语法、import语法、类定义、field定义、method定义、变量定义、表达式定义等,每个语法表达式用分号结束。

2)语法分析

对Token流进行语法分析,检查这些关键词组合在一起是不是符合Java语言规范,如if的后面是不是紧跟着一个布尔判断表达式。就像人类语言中,是不是有主谓宾,主谓宾结合得是不是正确,语法是不是正确。

形成一个符合Java语言规范的抽象语法树,抽象语法树是一个结构化的语法表达式形式,它的作用是把语言的主要词法用一个结构化的形式组织在一起。这颗语法树可以被我们后面按照新的规则重新组织。

将token流组建成更加结构化的语法树,也就是间一个个单词组装成一句话,一个完整的语句。哪些词语组合在一起是主语、哪些是谓语、哪些是宾语、哪些是定语,要做进一步区分。Java语法树使得Java源代码更加结构化:每个语法树上的节点都是com.sun.tools.javac.tree.JCTree的一个实例,①每个语法节点都会实现一个接口xxxTree,这个接口又继承于com.sun.source.tree.Tree接口,如IfTree语法节点表示一个if类型的表达式,BinaryTree语法节点代表一个二元操作表达式等;②每个语法节点都是com.sum.tools.javac.tree.JCTree的子类,并且会实现xxxTree接口类,这个类的类名类似于JCxxx,如实现IfTree接口的实现类为JCIf,实现BinaryTree接口的类为JCBinary等;③所有的JCxxx类都作为一个静态内部类在JCTree类中。

3)语义分析

把一些难懂的、复杂的语法转化成更加简单的语法。这个步骤类似将难懂的文言文转化成大家都能懂的白话文或者注解一下一些成语,便于人们更好地理解。

将复杂的语法转化成最简单的语法,对应到Java中,如将foreach转成for循环结构,还有注解等,最后形成一个注解过后的抽象语法树,这颗语法树更接近目标语言的语法规则。

com.sum.tools.javac.comp.Enter:符号表的构建

1)将Java类中的符号输入到符号表中

1)给类添加默认的构造函数

com.sun.tools.javac.processing.JavacProcessingEnvironment:annotation处理

2)处理annotation注解

com.sun.tools.javac.comp.Attr:标注和语法检查

3)检查操作变量类型是否匹配,操作数|方法返回值类型匹配com.sun.tools.javac.comp.Check

3)检查变量、方法或类的访问是否合法、变量是否是静态变量、变量在使用前是否已经初始化com.sun.tools.javac.comp.Resolve

3)推导出泛型方法中的参数类型com.sum.tools.javac.comp.Infer

3)将一些常量进行合并处理com.sum.tools.javac.comp.ConstFold

com.sun.tools.javac.comp.Flow数据流分析

4)检查变量在使用前是否已经正确赋值

4)包装final修饰的变量不会被重新赋值

4)方法的返回值类型都要确定

4)检查所有的操作是否可达

4)检查checked exception异常是否已经捕获或抛出

5)解除Java的语法糖

5)去掉无用的代码,如永假的if代码块

5)变量的自动转换,如将int自动包装成Integer类型或者相反的操作等;

4)代码生成器

根据经过注解的抽象语法树生成字节码,将一个数据结构转化为另一个数据结构,类似将所有的中文语句翻译成英文单词后按照英文语法组装成英文语句。

com.sun.tools.javac.jvm.Gen

①将Java方法中的代码块转成符合JVM语法的命令形式,JVM的操作都是基于栈的,所有的操作都必须经过出栈和进栈来完成。

②安装JVM的文件组织格式将字节码输出到以class为扩展名的文件中。

2个类:

①Items:任何可寻址的操作项,这些包括本地变量、类实例变量或者常量池中用户自定义的常量等,这些操作项都可以作为一个单位出现在操作栈上

②Code:存储生成的字节码和提供一些能够映射操作码的方法

Javac中访问者模式的实现

词法分析、语法分析、语义分析和代码生成都要多次遍历语法树,但每次遍历这颗语法树都会进行不同的处理动作。Javac采用访问者模式设计,每次遍历都是一次访问者的执行过程。

访问者模式可以将数据结构和对数据结构的操作解耦,使得增加对数据结构的操作不需要去修改数据结构,也不必去修改原有的操作,而执行时再定义新的Visitor实现者就可以。在Javac中不同的编译阶段都定义了不同的访问者模式实现。

①TreeScanner、Enter、Attr、Gen、Flow等都是作为具体访问者角色,每个访问者都定义了自己的访问规则.

②EJCIf、JCTry、JCBreak、JCReturn都是具体节点元素,作为一个稳定的数据结构存在。

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-10-17 05:38:50

javac 编译器原理的相关文章

Question20180104 对比编译器、解释器与Javac编译原理

编译器与Javac编译原理 在前文我们知道了Java是一种编译语言和解释语言,它的源代码经过编译器Javac编译为能够被JVM识别的二进制语言,然后JVM将其解释为能够被平台识别的机器语言.那么什么是编译器呢?编译器的作用是什么呢?Javac又是如何进行工作的?下面我们一一来认识了解. 1 编译器(Compiler ) 简单讲,编译器就是将“一种语言(通常为高级语言)”翻译为“另一种语言(通常为低级语言)”的程序.一个现代编译器的主要工作流程:源代码 (source code) → 预处理器 (

Knowledge Point 20180303 对比编译器、解释器与Javac编译原理

编译器与Javac编译原理 在前文我们知道了Java是一种编译语言和解释语言,它的源代码经过编译器Javac编译为能够被JVM识别的二进制语言,然后JVM将其解释为能够被平台识别的机器语言.那么什么是编译器呢?编译器的作用是什么呢?Javac又是如何进行工作的?下面我们一一来认识了解. 1 编译器(Compiler ) 简单讲,编译器就是将“一种语言(通常为高级语言)”翻译为“另一种语言(通常为低级语言)”的程序.一个现代编译器的主要工作流程:源代码 (source code) → 预处理器 (

第四章 Javac编译原理

4.1 Javac是什么 是一种编译器,将JAVA源代码(.java文件)语言先转化成JVM能够识别的一种语言(.class文件),然后由JVM将JVM语言再转化成当前机器可以识别的机器语言. 4.2 javac编译器的基本结构 javac编译器的作用是将符合JAVA语言规范的源代码转化成符合JAVA虚拟机规范的JAVA字节码. 词法分析:从源代码中找出一些规范的token流,就像在人类的语言中分辨出哪些是词语,标点符号,动词,名词等. 语法分析:形成一个符合JAVA语言规范的抽象语法树.语法树

javac编译原理(一)

我们都知道,计算机只能识别二进制语言,是不能直接识别java c c++等高级语言的.将高级语言转化成计算机可以是别的二进制语言,这个过程就叫编译. 有次面试,面试官问了一道“java的编译原理是什么”,当时给懵了,只知道是把java文件转换成class文件,然后由jvm执行,具体流程就不知道了.今天看了许令波编著的<深入分析java web技术内幕>一书,其中有一章讲的就是javac的编译原理,看了一遍,感觉有点云里雾里,不是很明白,接下还得多看看几遍,多上网查查资料深入透彻的学习一下. 今

&lt;&lt;深入分析javaWeb技术内幕&gt;&gt;读书笔记-Javac编译原理

1.javac是什么? javac是一种编译器,能将一种语言规范转化为另一种语言规范. 2.javac的任务是什么? 将java源代码语言先转化成JVM能够识别的的一种语言,然后由JVM再将JVM语言转化成当前机器识别的机器语言.表面上,将.java文件转成.class文件,而实际上是将java源代码转化成一串能被jvm识别的有格式二进制数字. 3.javac编译器的基本结构

javac编译原理

java源代码(符合语言规范)-->javac-->.class(二进制文件)-->jvm-->机器语言(不同平台不同种类) 如何让java的语法规则适应java虚拟机的语法规则?这个任务由javac编译器来完成java语言规范转换成java虚拟机语言规范. 编译流程: 流程: 词法分析器:将源码转换为Token流 将源代码划分成一个个Token(找出java语言中的if,else,for等关键字) 语法分析器:将Token流转化为语法树 将上述的一个个Token组成一句句话(或者

Javac编译器早期优化

Java的早期(编译器)优化 1. Javac编译器 1.1 编译步骤 编译过程可分为3个步骤: 解析与填充符号过程 插入式注解处理器的注解处理过程 分析与字节码生成过程 1.2 解析与填充符号表 解析步骤包含了词法分析和语法分析两个过程. 1.2.1 词法.语法分析 词法分析是将源代码的字符流转变为标记(Token)集合,标记是编译过程的最小元素. 语法分析是根据Token序列构建抽象语法树的过程. 抽象语法树是一种用来描述程序代码语法结构的树形表示方式,语法树中的每一个节点都代表着程序代码中

早期(编译器)优化--javac编译器

java语言的"编译期"其实是一段"不确定"的操作过程,可能是指一个前端编译器把.java变成.class的过程,也可能是指虚拟机的后端运行期编译器(JLT)把字节码转变成机器码的过程,也有可能是使用静态提前编译器(AOT)直接把.java文件直接编译成本地机器代码的过程.现在讨论的是第一种编译器. Javac编译器 ①javac的源码与测试   运行com.sun.tools.javac.Main的main()方法来执行编译,与命令行中使用javac的命令没什么区

Javac 编译原理

写在前面 JDK & JRE  JRE(Java Runtime Enviroment)是Java的运行环境.面向Java程序的使用者,而不是开发者.如果你仅下载并安装了JRE,那么你的系统只能运行Java程序.JRE是运行Java程序所必须环境的集合,包含JVM标准实现及 Java核心类库.它包括Java虚拟机.Java平台核心类和支持文件.它不包含开发工具(编译器.调试器等). JDK(Java Development Kit)又称J2SDK(Java2 Software Developme