编译器把一种语言规范转化为另一种语言规范的这个过程需要哪些步骤:
(1) 词法分析:读取源代码,一个字节一个字节的读进来,找出这些词法中哪些是我们定义的语言关键词如:if else where 等 识别哪些if是合法的哪些是不合法的。
词法分析的结果:就是从源代码中找出一些规范化的token流,就像人类语言中,给你一句话你要分辨出哪些是一个词语,哪些是标点符号,哪些是动词,哪些是名词。
(2) 语法分析:就是在词法分析中得到的token流进行语言分析,这一步就是检查这些关键词组合在一起是不是符合java语言规范。如if的后面是不是紧跟着一个布尔型判断表达式。
语法分析的结果:就是形成一个符合java语言规定的抽象语法树,抽象语法树是一个结构化的语法表达形式,它的作用是把语言的主要词法用一个结构话的形式组织在一起。这棵语法树可以被我们后面按照新的规则再重新组织。
(3)语义分析:语法分析完成之后也就不从在语法问题了,语义分析的主要工作就是把一些难懂的,复杂的语法转化成更简单的语法。就如难懂的文言文转化为大家都懂的百话文,或者是注释一下一些不懂的成语。
语义分析结果:就是将复杂的语法转化为简单的语法对应到java就是将foreach转化为for,还有一些注释等。最后生成一棵抽象的语法树,这棵语法树也就更接近目标语言的语法规则。
(4)代码生成: 将会根据经过注释的抽象语法树生成字节码,也就是将一个数据结构转化为另外一个数据结构。就像将所有的中文词语翻译成英文单词后按照英文语法组装文英文语句。
代码生成器的结果就是生成符合java虚拟机规范的字节码。
代码生成器的结果就是生成符合java虚拟机规范的字节码。这个过程中的需要的组件有:
总结:
从上面的描述中我们知道编译就是将一种语言通过分析分解在按照一定的方式先形成一个简单的框架(将java源文件的字节流转化为对应的token流)然后
在通过详细的分析按照一定的规定在这个框架里添加东西使这个token流形成更加结构化的语法树(就是将前面生成的token流中的一个个单词组装成一句
话),但是这棵树我们的目标java字节码还有点差距所以在进行语义分析使那颗粗糙的树更加完整完善(给类添加默认的构造函数,检查变量在使用前有没有初
始化,检查操作变量类型是否匹配)然后javac(编译器)调用com.sun.tools.javac.jvm.Gen类遍历这棵语法树将java方法
中的代码块转换成符合JVM语法的命令形式,JVM的操作是通过入栈和出栈来完成。按照JVM的文件组织格式将字节码输出到以class为扩展名的文件
中,也就是生成最终的java字节码。
简单理解: 词法分析就是将关键词组织成token流即检查源码中的的关键词是否真确并组织成token流,而语法分析就是检查源码是否符合java
语法规范并将词组成语句。语义分析就是简化复杂的添加缺少的,检查变量类型是否合法。代码生成器就是遍历这棵树生成符合JVM规范的代码。
一般编辑的过程是:将源文件---->目标文件-----> 可执行文件(机器码)