gcc 源码分析-前端篇2

2. 对ID及保留字的处理

在c语言中,系统预留了很多关键字,也被称为保留字,比如表示数据类型的int,short,char,控制分支执行的if,then等。

任何关键字,本质上也是一个ID,比如它也有长度,对int就是3,对short就是5,也有内容,比如int,short。但比起一般id,

它还有其他一些属性,比如表示数据类型的int,它有一个数值范围,它的值范围是-xxx到xxx之间。

由于这样的关系,gcc把ID和关键字都保存在一张表中,这张表定义如下:

#define MAX_HASH_TABLE 1009

tree hash_table[MAX_HASH_TABLE];    /* id hash buckets */

同时定义了一个函数get_identifier (text) 来操纵这一张表:

函数具体实现就是通过传入的字串查找该id,如果没有则创建这个ID,这里new了一个tree_identifier, 同时把它保存在hash_table表中,为了加快查找,这里用到了hash算法。在这里我们见到了struct tree_common结构体chain成员的用法,对于hash算法来说,很难避免冲突,对于传入的不同字串,有可能它算出的hash值是一样的,这时候,我们就把相冲突的ID放在chain成员变量中;

函数的最后给tree_identifier的成员length,pointer附值。

gcc 在执行之初,便开始创建这些表示数据类型的关键字,比如int,short,char,void,这个在函数init_lex依次创建,并把创建的相对应的

tree 结点附给:

ridpointers[(int) RID_INT]

ridpointers[(int) RID_CHAR]

ridpointers[(int) RID_VOID]

ridpointers[(int) RID_SHORT]

关键字的ID生成了,还有附一些其他参数,这个过程是在init_decl_processing完成;在GCC中要表示一个数据类型,要用到下面的结构:

struct tree_type

{

char common[sizeof (struct tree_common)];

union tree_node *values;

union tree_node *sep;

union tree_node *size;

enum machine_mode mode : 8;

unsigned char size_unit;

unsigned char align;

unsigned char sep_unit;

union tree_node *pointer_to;

union tree_node *reference_to;

int parse_info;

int symtab_address;

union tree_node *name;

union tree_node *max;

union tree_node *next_variant;

union tree_node *main_variant;

union tree_node *basetypes;

union tree_node *noncopied_parts;

/* Points to a structure whose details depend on the language in use.  */

struct lang_type *lang_specific;

};

在表示int型的数据类型中,它的两个成员变量sep,max比较重要; sep表示它的最小值,而max表示它的最大值;

在函数make_signed_type中创建了一个 INTEGER_TYPE 类型的tree 节点;它实际上是一个 struct tree_type 类型的节点,

在该函数中,创建的节点的sep,max成员被赋予INTEGER_CST 节点,它实际上是一个struct tree_int_cst类型节点:

struct tree_int_cst

{

char common[sizeof (struct tree_common)];

long int_cst_low;

long int_cst_high;

};

可以看出,它有两个成员特殊成员:int_cst_low,int_cst_high

对于最小值,它给出的值是: int_cst_low=0x80000000,int_cst_high=0xffffffff

对于最大值,它给出的值是:int_cst_low=0x7fffffff,int_cst_high=0x0

它们均是在build_int_2 函数中创建;

在函数make_signed_type的最后layout_type中,设定int 型数据节点的size成员,它也是一个struct tree_int_cst类型节点,只是它的

int_cst_low值是4,而int_cst_high为0;

这样int型节点生成了,这个节点数据和它的ID,最后被封装成一个声明类型节点,它用struct tree_decl结构体表示:

struct tree_decl
{
  char common[sizeof (struct tree_common)];
  char *filename;
  int linenum;
  union tree_node *size;
  enum machine_mode mode : 8;
  unsigned char size_unit;
  unsigned char align;
  unsigned char voffset_unit;
  union tree_node *name;
  union tree_node *context;
  int offset;
  union tree_node *voffset;
  union tree_node *arguments;
  union tree_node *result;
  union tree_node *initial;
  char *print_name;
  char *assembler_name;
  struct rtx_def *rtl;    /* acts as link to register transfer language
                   (rtl) info */
  int frame_size;        /* For FUNCTION_DECLs: size of stack frame */
  struct rtx_def *saved_insns;    /* For FUNCTION_DECLs: points to insn that
                   constitutes its definition on the
                   permanent obstack.  */
  int block_symtab_address;
  /* Points to a structure whose details depend on the language in use.  */
  struct lang_decl *lang_specific;
};

可以看出,这是一个巨复杂的结构,int 类型节点转变成一个int 声明节点过程中,它将生成一个struct tree_decl节点,它的

成员变量name将是int 的ID节点值,它的type 就是刚刚生成的int 节点,这个int 声明节点最后会被放入到记录全局节点的

global_binding_level中,

global_binding_level->name 指向刚刚创建的int 声明节点;

在init_decl_processing函数接下来将创建char 类型节点,unsigned int 类型,short 类型,这些值都回放入global_binding_level->name

然后通过chain连接起来;

总结一下,gcc 用hash表来储存所有的ID,包括保留字;gcc 对于内建的数据类型(int,short,char)在初始化时会生成tree_decl 结构的结点,

并把它记录在global_binding_level的name变量中,这个name始终指向最后一个声明的结点,并通过节点的chain串接起来。

版权声明:本文为博主原创文章,未经博主允许不得转载。

时间: 2024-11-10 13:27:00

gcc 源码分析-前端篇2的相关文章

gcc 源码分析-前端篇1

前年写了 gcc源码分析,感觉写的不好,如果没有源代码读起来很痛苦,基本上是读天书,这一次改了一种写法,用另一种思路来写,希望这一次能好一点: 1.基本数据结构 编译器前端主要的任务就是把输入的源码转换成一棵语法树, 在gcc中,树的每一个节点用一个结构体来表示,下面就来谈一谈gcc中用到的这个结构体: union tree_node { struct tree_common common; struct tree_identifier identifier; struct tree_list

gcc 源码分析-前端篇3

3. GCC如何函表示一个函数 对c语言来说,函数是其核心,所有的东西都在围绕着函数在转.对于一个函数来说,它主要的一些特性如下: 1. 有一个返回值,在这里我们没有把返回值的函数认为它的返回值是void; 2. 它有传入的参数,而这个参数个数不确定,可多可少,也可以没有: 3. 它有一个函数名称,这个名称具有唯一性,也就是同一个工程,不能有名称一样的多个函数: 4. 它有函数执行体: 对于函数来说,还是通过struct tree_decl结构来表示: filename:函数所在文件名: lin

Android事件传递机制详解及最新源码分析——ViewGroup篇

在上一篇<Android事件传递机制详解及最新源码分析--View篇>中,详细讲解了View事件的传递机制,没掌握或者掌握不扎实的小伙伴,强烈建议先阅读上一篇. 好了,废话还是少说,直奔主题,开始本篇的ViewGroup事件传递机制探索之旅. 依然从简单的Demo例子现象开始分析 新建安卓工程,首先自定义一个Button以及一个RelativeLayout,很简单,只是重写了主要与事件传递机制相关的方法,代码如下: 自定义WLButton类: 1 public class WLButton e

JUC源码分析-集合篇(三)ConcurrentLinkedQueue

JUC源码分析-集合篇(三)ConcurrentLinkedQueue 在并发编程中,有时候需要使用线程安全的队列.如果要实现一个线程安全的队列有两种方式:一种是使用阻塞算法,另一种是使用非阻塞算法.使用阻塞算法的队列可以用一个锁(入队和出队用同一把锁)或两个锁(入队和出队用不同的锁)等方式来实现.非阻塞的实现方 式则可以使用循环 CAS 的方式来实现.本节让我们一起来研究一下 Doug Lea 是如何使用非阻塞的方式来实现线程安全队列 ConcurrentLinkedQueue 的,相信从大师

JUC源码分析-集合篇(五)BlockingQueue 阻塞式队列实现原理

JUC源码分析-集合篇(五)BlockingQueue 阻塞式队列实现原理 以 LinkedBlockingQueue 分析 BlockingQueue 阻塞式队列的实现原理. 1. 数据结构 LinkedBlockingQueue 和 ConcurrentLinkedQueue 一样都是由 head 节点和 last 节点组成,每个节点(Node)由节点元素(item)和指向下一个节点(next)的引用组成,节点与节点之间就是通过这个 next 关联起来,从而组成一张链表结构的队列.默认情况下

JUC源码分析-集合篇(七)PriorityBlockingQueue

JUC源码分析-集合篇(七)PriorityBlockingQueue PriorityBlockingQueue 是带优先级的无界阻塞队列,每次出队都返回优先级最高的元素,是二叉树最小堆的实现. PriorityBlockingQueue 数据结构和 PriorityQueue 一致,而线程安全性使用的是 ReentrantLock. 1. 基本属性 // 最大可分配队列容量 Integer.MAX_VALUE - 8,减 8 是因为有的 VM 实现在数组头有些内容 private stati

Spring 事务源码分析——Hibernate篇

在Spring与Hibernate整合的时候,可以利用Spring的事务管理机制,为我们管理事务的开启.提交.回滚等操作.这样的方式极大的减少了我们的代码量,让我们只专注于业务代码的编写.在使用Hibernate的时候,每一个操作都要经历事务开启与提交这样的操作,他们在业务代码的周围,这样来看是不是就想到了AOP编程,把这部分代码抽取出来.没错,Spring正是这样做的,Spring的事务管理就是基于AOP的. 1 Spring的事务隔离与传播 Srping的事务定义了五个隔离等级(isolat

zepto源码分析------事件篇

说说zepto.js的源码.今天先分析事件,我比较懒,前面的基础函数就不分析了.直接按模块写就可以了. 在分析之前先简单的说一下zepto的大致结构 var Zepto = (function{})() // 事件模块 (function($){})(zepto) //ajax模块 (function($){})(zepto) // form事件 (function($){})(zepto) 大致结构就是这样了;其实里面的函数也挺简单的,我们都知道zepto这个框架是专为移动端开发,可谓是短小精

zepto源码分析------ajax篇

上级研究了zepto的事件,也说了一下zepto的主要模块构成.恩,今天来说说的zepto的ajax是如何实现. 好的,和上次一样,先上代码再说. $.ajax = function(options) { // 覆盖配置 var settings = $.extend({}, options || {}), // 没有找到在哪里 deferred = $.Deferred && $.Deferred(), urlAnchor // 完成完整对配置覆盖 for (key in $.ajaxS