LLVM和GCC的区别

最近在Mac OS X Mountain Lion下用Xcode进行开发,发现在编译选项里有如下所示的这两种编译器:一个是Apple LLVM compiler 4.2,另外一个是LLVM GCC 4.2。

近几年一直听人说LLVM比GCC好,但是我一直没有时间研究这二者的差别。由此问题出发,我又给自己抛出了很多疑问:

  • cc, c89, c99是什么?有何区别?
  • gcc, g++, cpp, gpp又是什么?
  • LLVM与GCC区别大吗?
  • Apple LLVM compiler 4.2和LLVM GCC 4.2有何区别?
  • LLVM GCC 4.2到底是LLVM还是GCC?

接下来让我们一起补补历史课。

CC, C89, C99

Unix诞生之后,很多公司都开发了自己的Unix系统并且使用了自己专门的编译器。这样就导致在不同的Unix系统上,想编译C语言代码就需要使用不同的命令。于是POSIX标准Commands and Utilities中就规定了将CC作为不同编译器的统一命令接口,并且也规定了CC命令需要提供哪些必须的参数。

随着后续ISO C标准的确定,POSIX标准又规定分别将C89C99作为ISO C的接口,而CC则继续作为非标准C的接口。但实际上后续大多数C语言编译器都实现了ISO C标准,所以POSIX标准规定后续应将CC这一历史遗留的命令取消。

GCC, G++, CPP, GPP

随着开源运动的兴起,自由软件基金会开发了自己的开源免费的C语言编译器GNU C Compiler,简称GCC。GCC中提供了C Preprocessor这个C语言的预处理器,简称CPP。后来GCC又加入了对C++等其它语言的支持,所以他的名字也改为GNU Compiler Collection。G++则是专门用来处理C++语言的。在GNU的官方手册中,有一个章节叫做G++ and GCC介绍了这二者的区别。G++是GCC编译器集合的一个前端。关于前端、后端的概念下面有更详细的介绍。而GPP呢,这个名字比较特殊,如果你用的是Linux系统,可能并没有这个命令。但是在某些特殊的系统下,例如DOS,是无法创建G++这样带有特殊符号的文件名的。所以按照DJGPP编译器的做法,GPP其实就是G++。

LLVM与GCC

回顾GCC的历史,虽然它取得了巨大的成功,但开发GCC的初衷是提供一款免费的开源的编译器,仅此而已。可后来随着GCC支持了越来越多的语言,GCC架构的问题也逐渐暴露出来。但GCC到底有什么问题呢?我们一起看看这篇文章:The Architecture of Open Source Applications: LLVM。LLVM的优点也正是GCC的缺点。

传统编译器

传统编译器的工作原理基本上都是三段式的,可以分为前端(Frontend)、优化器(Optimizer)、后端(Backend)。前端负责解析源代码,检查语法错误,并将其翻译为抽象的语法树(Abstract Syntax Tree)。优化器对这一中间代码进行优化,试图使代码更高效。后端则负责将优化器优化后的中间代码转换为目标机器的代码,这一过程后端会最大化的利用目标机器的特殊指令,以提高代码的性能。

事实上,不光静态语言如此,动态语言也符合上面这个模型,例如Java。Java Virtual Machine也利用上面这个模型,将Java代码翻译为Java bytecode。

这一模型的好处是,当我们要支持多种语言时,只需要添加多个前端就可以了。当需要支持多种目标机器时,只需要添加多个后端就可以了。对于中间的优化器,我们可以使用通用的中间代码。

这种三段式的结构还有一个好处,开发前端的人只需要知道如何将源代码转换为优化器能够理解的中间代码就可以了,他不需要知道优化器的工作原理,也不需要了解目标机器的知识。这大大降低了编译器的开发难度,使更多的开发人员可以参与进来。

虽然这种三段式的编译器有很多有点,并且被写到了教科书上,但是在实际中这一结构却从来没有被完美实现过。做的比较好的应该属Java和.NET虚拟机。虚拟机可以将目标语言翻译为bytecode,所以理论上讲我们可以将任何语言翻译为bytecode,然后输入虚拟机中运行。但是这一动态语言的模型并不太适合C语言,所以硬将C语言翻译为bytecode并实现垃圾回收机制的效率是非常低的。

GCC也将三段式做的比较好,并且实现了很多前端,支持了很多语言。但是上述这些编译器的致命缺陷是,他们是一个完整的可执行文件,没有给其它语言的开发者提供代码重用的接口。即使GCC是开源的,但是源代码重用的难度也比较大。

LLVM

LLVM最初是Low Level Virtual Machine的缩写,定位是一个虚拟机,但是是比较底层的虚拟机。它的出现正是为了解决编译器代码重用的问题,LLVM一上来就站在比较高的角度,制定了LLVM IR这一中间代码表示语言。LLVM IR充分考虑了各种应用场景,例如在IDE中调用LLVM进行实时的代码语法检查,对静态语言、动态语言的编译、优化等。

从上面这个图中我们发现LLVM与GCC在三段式架构上并没有本质区别。LLVM与其它编译器最大的差别是,它不仅仅是Compiler Collection,也是Libraries Collection。举个例子,假如说我要写一个XYZ语言的优化器,我自己实现了PassXYZ算法,用以处理XYZ语言与其它语言差别最大的地方。而LLVM优化器提供的PassA和PassB算法则提供了XYZ语言与其它语言共性的优化算法。那么我可以选择XYZ优化器在链接的时候把LLVM提供的算法链接进来。LLVM不仅仅是编译器,也是一个SDK。

Apple LLVM compiler 4.2和LLVM GCC 4.2

现在我们可以回答本文最前面我遇到的那个问题了。Apple LLVM compiler 4.2是一个真正的LLVM编译器,前端使用的是Clang,基于最新的LLVM 3.2编译的。LLVM GCC 4.2编译器的核心仍然是LLVM,但是前端使用的是GCC 4.2编译器。从LLVM的下载页面可以看出,LLVM从1.0到2.5使用的都是GCC作为前端,直到2.6开始才提供了Clang前端。

时间: 2024-12-25 02:58:56

LLVM和GCC的区别的相关文章

LLVM和GCC的区别(LLVM提供了模块化的编译模块,非常有利于重用,以前的编译器都没有做到这一点)

最近在Mac OS X Mountain Lion下用Xcode进行开发,发现在编译选项里有如下所示的这两种编译器:一个是Apple LLVM compiler 4.2,另外一个是LLVM GCC 4.2. 近几年一直听人说LLVM比GCC好,但是我一直没有时间研究这二者的差别.由此问题出发,我又给自己抛出了很多疑问: cc, c89, c99是什么?有何区别? gcc, g++, cpp, gpp又是什么? LLVM与GCC区别大吗? Apple LLVM compiler 4.2和LLVM

[转]G++与GCC的区别

转自http://www.52pojie.cn/thread-58109-1-1.html 误区一:gcc只能编译c代码,g++只能编译c++代码两者都可以,但是请注意:1.后缀为.c的,gcc把它当作是C程序,而g++当作是c++程序:后缀为.cpp的,两者都会认为是c++程序,注意,虽然c++是c的超集,但是两者对语法的要求是有区别的.C++的语法规则更加严谨一些.2.编译阶段,g++会调用gcc,对于c++代码,两者是等价的,但是因为gcc命令不能自动和C++程序使用的库联接,所以通常用g

linux下Clang和gcc的区别

Clang 比 GCC 编译器的优势: 编译速度更快 编译产出更小 出错提示更友 好,比如 clang 在编译过程可以直接指出相对简单的出错位置以及它 “ 认为 ” 正确的方式 . 内置有静态分析工具,可以对代码进行静态分析 (clang—analyze) .这也是 gcc 做不到的 . 专注,因为 clang 只需要完成词法和语法分析,代码优化和机器代码的生成工作由 llvm 完成.所以和全部由自己包下的 gcc 比起来, clang 可以更专注地做好一件事.这种结构也使 clang 可以被单

iOS中的预编译指令的初步探究

看到非常好的两篇技术文,转来方便自己查看. 转自:http://www.cnblogs.com/daiweilai/p/4234336.html 开篇 我们人类创造东西的时候有个词叫做”仿生学“!人类创造什么东西都会模仿自己来创造,所以上帝没有长成树的样子而和人长得一样,科幻片里面外星人也像人一样有眼睛有鼻子……但是人类自己创造的东西如果太像自己,自己又会吓尿(恐怖谷效应),人类真是奇葩:奇葩的我们在20世纪创造了改变世界的东西——计算机(电脑),不用怀疑,这货当然也是仿生学!这货哪里长得像人了

iOS中的预编译指令

iOS中的预编译指令的初步探究 目录[+] 开篇 我们人类创造东西的时候有个词叫做”仿生学“!人类创造什么东西都会模仿自己来创造,所以上帝没有长成树的样子而和人长得一样,科幻片里面外星人也像人一样有眼睛有鼻子……但是人类自己创造的东西如果太像自己,自己又会吓尿(恐怖谷效应),人类真是奇葩:奇葩的我们在20世纪创造了改变世界的东西——计算机(电脑),不用怀疑,这货当然也是仿生学!这货哪里长得像人了??别不服,先听我说完,先把你的砖头放下.狭义的仿生学是外形上仿生嘛,其实广义上仿生学还可以原理的仿生

1st.初识GCC——关于GCC编译器的相关语法与介绍

一个C文件要变成可执行的文件,需要经过四个过程 预处理(处理以"#"为开头的命令) 编译(将.c .i等文件翻译成汇编代码) 汇编(将汇编代码翻译成机器代码) 连接(将生成的多个目标文件(.o文件)连接起来,生成可执行文件) 主要用到的工具叫做arm-linux-gcc,arm-linux-ld,本次学习的是gcc工具. 几条常用命令选项: -E:        预处理后即停止 -S:        编译后不汇编 -c:        预处理+编译+汇编,但不连接      -o fi

gcc makefile

GCC程序编译 GCC (GNU C Compiler) 编译器,GNU 本身是一个计划,目标是开发出一套完全免费的操作系统,GCC就是他推出很好的多平台编译器,不管是嵌入式应用程序开发 还是做驱动开发内核开发 嵌入式内核开发 都需要用到它,用它可以编译链接C C++等程序, GCC 支持的体系结构有40余种,常见的有X86  ARM POWERPC 等等同时GCC还能运行在不同的操作系统中,如LINUX WINDOWS Solaris 等,GCC除支持C语言外还支持多种语言,如C++ ,Ada

Mac OS 下的 gcc gdb

好久没有写c了,今天和老婆大人一起做了一下微软的网上编程题.发现忘了好多. 由于有运行时错误,所以想用gdb调试一下,发现没有gdb,遂使用homebrew安装,结果安装出错.后来发现错误的原因应该是找不到gcc!可是我一直用gcc编译程序的啊,好奇怪! 这两天vpn不稳定,只能百度,好不容易才发现了原因: 从Mac OS 10.9开始,安装Xcode5时不会再安装gcc了,而系统中的gcc实际上只是一个别名. $ gcc -v Configured with: --prefix=/Applic

linux下gcc编译的参数详细说明

参考网址:1 http://hi.baidu.com/zengzhaonong/item/f1f9383565fa5c302e0f8125 gcc使用方法 汇总 2 http://s99f.blog.163.com/blog/static/35118365201311261453629/ gcc参数区别 3    http://blog.csdn.net/ruglcc/article/details/7814546       makefile教程 刚接触linux下的C编程.以前做项目时,接触