用C++对C++语法格式进行分析

前言

最近C++项目需要用到脚本,这就关系到如何绑定对象到脚本运行环境。因使用到多套脚本语言,所以现有的绑定技术,都不能满足需求。所以只能寻求解析C++的头文件,再根据描述进行绑定。起初发现boost有一套,但boost实在太臃肿了,对项目之后开发环境的搭建有一定要求。我力求最简明的项目管理,boost不太适合。自己写套吧。

正文

C++的语法格式总结

  • 除编译器指令#开头与函数外,均必须要求分号结尾
  • 代码块除单条语句的if、do/while、for都必须在大括号/花括号“{}”
  • 代码块有8种,命名空间,全局,类,结构,全局函数,成员函数,lambda,函数内无名代码块

    • 命名空间与全局相同,仅在声明前加“命名空间::”前缀
    • 类声明块与全局块的区别有,友元声明,成员访问权限
  • 模板支持类与函数
  • 函数与模板有参数列表
  • 分号结尾的声明可以是内置类型(int、double等)、类、模板类、typedef出来的类型、函数指针、lambda
  • 函数可以重名
  • 类的成员函数访问其他成员可以在此函数定义之后声明,并不像全局函数那样必须已经声明,所以用指针扫描一次C++文件是否合法是做不到的
  • 若是类化的枚举(enum class),不需要对声明所在范围可见,否则同时要把成员也同时添加到所属范围

我不打算支持的,对于需求没有必要性的

  • 命名空间
  • 模板
  • 函数体
  • 逗号分割的多个变量我不想很好的支持
  • 类型的校验
  • 默认参数
  • union
  • 枚举不判断名称冲突
  • lambda
  • 变量名不能以数字开始
  • 类的继承
  • 函数指针

开发的原则

  • 暂不跨平台,仅VS,不使用系统API这样适于修改为跨平台
  • 使用C++
  • iter只进不退
  • 遇到语法错误或文件结尾,抛异常
  • 遇到{则进入块处理
  • 处理;结尾的语言单元,函数必须自己处理完;及之前的内容再返回
  • 成员函数定义代码不分析,因为第一条原则做不到,成员函数可能会引用还未声明的其他成员函数
  • 不为最好的性能,但可以在这个结构上优化到极致
  • 不求完整解析,但在这个框架上可以做到解析全部c++11与更高的版本特性
  • 无注释,英文不好,中文注释又不适合全球化

结构描述

variant,method,type,comment,enumeration,enumeration_value从object继承,它们都可以属于全局或类或结构体。

document表示一个c++编译单元。

context表示一个上下文,是一个可以向上查找的队列。document完成解析后存储解析出来的变量、函数、类型。

reader,文件读取器,一个向前的char迭代器,可以用istreambuf_iterator<char>(ifstream)替代。

使用

main函数有_DEBUG宏保护,建议编译为库release使用。

#include <cpp_analysis.h>

try

{
 auto result = cpp_analysis::analysis("[cpp_header_file]");

 // todo

}
catch (logic_error& e)
{

// todo:
}

项目位置

https://github.com/FettLuo/cpp_analysis[新标签打开]

时间: 2024-08-27 00:06:41

用C++对C++语法格式进行分析的相关文章

Linux C中内联汇编的语法格式及使用方法(Inline Assembly in Linux C)

在阅读Linux内核源码或对代码做性能优化时,经常会有在C语言中嵌入一段汇编代码的需求,这种嵌入汇编在CS术语上叫做inline assembly.本文的笔记试图说明Inline Assembly的基本语法规则和用法(建议英文阅读能力较强的同学直接阅读本文参考资料中推荐的技术文章 ^_^). 注意:由于gcc采用AT&T风格的汇编语法(与Intel Syntax相对应,二者的区别参见这里),因此,本文涉及到的汇编代码均以AT&T Syntax为准. 1. 基本语法规则 内联汇编(或称嵌入汇

Oracle Update 语句语法与性能分析 - 多表关联

Oracle Update 语句语法与性能分析 - 多表关联 为了方便起见,建立了以下简单模型,和构造了部分测试数据: 在某个业务受理子系统BSS中, SQL 代码 --客户资料表 create table customers ( customer_id number(8) not null, -- 客户标示 city_name varchar2(10) not null, -- 所在城市 customer_type char(2) not null, -- 客户类型 ... ) create

Lambda表达式的语法格式

Lambda表达式的语法格式: 参数列表 => 语句或语句块 “Lambda表达式”是委托的实现方法,所以必须遵循以下规则: 1)“Lambda表达式”的参数数量必须和“委托”的参数数量相同: 2)如果“委托”的参数中包括有ref或out修饰符,则“Lambda表达式”的参数列中也必须包括有修饰符: 3)如果“委托”有返回类型,则“Lambda表达式”的“语句或语句块”中也必须返回相同类型的数据: 4)如果“委托”有几种数据类型格式而在“Lambda表达式”中“编译器”无法推断具体数据类型时,则

switch语句语法格式

switch语句语法格式Switch是多条件判断语句. 注意:使用switch中的表达式里面只能放字符或数字 使用时不要忘了在case语句之后加上一个break,表示退出整个语句,如果不加入此语句,它会从第一个满足条件的地方开始后续的都要被执行.我们看下如果在case语句后面没有加上break话会出现什么结果我们发现不应该输出的case 2也输出了.我们再修改下i值为2,加个case 3看下效果.我们发现不满足条件的case 1没有被输出,而case 2和case 3输出了,所以我们也验证了如果

php正则表达式入门-常用语法格式

原文地址:http://www.jbxue.com/article/24467.html 分享下php正则表达式中的一些常用语法格式,用于匹配字母.数字等,个人感觉还不错. 语法格式:位于定界符"/"之间.较为常用的元字符包括: “+”, “*”,以及 “?”.其中, “+”元字符规定其前导字符必须在目标对象中连续出现一次或多次, “*”元字符规定其前导字符必须在目标对象中出现零次或连续多次, 而“?”元字符规定其前导对象必须在目标对象中连续出现零次或一次. /jim{2,6}/<

Linux下AT&amp;T汇编语法格式与Intel汇编语法格式异同

由于绝大多数的国内程序员以前只接触过Intel格式的汇编语言,很少或几乎没有接触过AT&T汇编语言,虽然这些汇编代码都是Intel风格的.但在Unix和Linux系统中,更多采用的还是AT&T格式,两者在语法格式上有着很大的不同,其实完全可以使用原来汇编的思路解决问题,只要掌握下面两者的不同: 一.在AT&T汇编格式中,寄存器名要加上' %'作为前缀:而在Intel汇编格式中,寄存器名不需要加前缀.例如: AT&T格式 Intel格式 pushl %eax push eax

IIS rewrite映射规则语法格式

IIS rewrite映射规则语法格式,特殊符号:&请用& amp;代替,否则异常. <configuration> <system.webServer> <rewrite> <rules> <rule name="bbs board" enabled="true"> <match url="^forum_([0-9]+)\.htm$" /> <acti

XWIKI支持MarkDown语法格式

最近开发同事需要在XWIKI页面显示JSON格式和其他一些代码.开发同事平时习惯使用Mardown编辑他们的文档,为了把这些文档直接添加到XWIKI页面,需要XWIKI能够支持Markdown语法格式. 参考文章 http://rendering.xwiki.org/xwiki/bin/view/Main/ http://maxiang.info/#/?id=readme 编辑xwiki.cfg,添加markdown语法支持 #-# [Since 1.6RC1] Defines the list

&lt;08&gt;while循环介绍及基本格式+while循环使用陷阱+统计键盘输入字符个数+while循环使用注意+do-while循环介绍及语法格式+do-while和while的对比+for循环结构及执行过程+for循环的其他形式

while循环介绍及基本格式(掌握): 循环结构: 当条件满足的时候 ,程序会重复的执行某一个代码段 构成循环结构的条件: 1)循环控制条件 2)循环体 3)让循环控制条件为假的控制 while循环的格式: while(表达式){ 语句块; } 1 #include <stdio.h> 2 3 void test1(){ 4 5 int i=1; 6 7 // 1)循环控制条件 8 while(i<=1000){ 9 10 //2)循环体 11 printf("第%d次说:我爱