JSON解析器实现(C++)

JSON介绍

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。 易于人阅读和编写。同时也易于机器解析和生成。 它基于JavaScript Programming Language, Standard ECMA-262 3rd Edition - December 1999的一个子集。 JSON采用完全独立于语言的文本格式,但是也使用了类似于C语言家族的习惯(包括C, C++, C#, Java, JavaScript, Perl, Python等)。 这些特性使JSON成为理想的数据交换语言。

JSON建构于两种结构:

  • “名称/值”对的集合(A collection of name/value pairs)。不同的语言中,它被理解为对象(object),纪录(record),结构(struct),字典(dictionary),哈希表(hash table),有键列表(keyed list),或者关联数组 (associative array)。
  • 值的有序列表(An ordered list of values)。在大部分语言中,它被理解为数组(array)。

这些都是常见的数据结构。事实上大部分现代计算机语言都以某种形式支持它们。这使得一种数据格式在同样基于这些结构的编程语言之间交换成为可能。

JSON数据结构

对象是一个无序的“‘名称/值’对”集合。一个对象以“{”(左括号)开始,“}”(右括号)结束。每个“名称”后跟一个“:”(冒号);“‘名称/值’ 对”之间使用“,”(逗号)分隔。

数组是值(value)的有序集合。一个数组以“[”(左中括号)开始,“]”(右中括号)结束。值之间使用“,”(逗号)分隔。

值(value)可以是双引号括起来的字符串(string)、数值(number)、truefalsenull、对象(object)或者数组(array)。这些结构可以嵌套。

字符串(string)是由双引号包围的任意数量Unicode字符的集合,使用反斜线转义。一个字符(character)即一个单独的字符串(character string)。

字符串(string)与C或者Java的字符串非常相似。

数值(number)也与C或者Java的数值非常相似。除去未曾使用的八进制与十六进制格式。除去一些编码细节。

空白可以加入到任何符号之间。 以下描述了完整的语言。

注意:以上上几张图,是我们进行解析的关键。

定义基本的数据结构

首先定义JSON数据类型:

enum JSONVALUETYPE
{
    JSONVALUETYPE_NULL,   ///< @brief 空类型
    JSONVALUETYPE_BOOL,   ///< @brief 逻辑类型
    JSONVALUETYPE_NUMBER, ///< @brief 数字类型
    JSONVALUETYPE_STRING, ///< @brief 字符串类型
    JSONVALUETYPE_LIST,   ///< @brief 表类型
    JSONVALUETYPE_DICT,   ///< @brief 字典类型
};

接着定义JSON的基本数据结构:

根据上面几张图,可知JSON的数据结构有以下几种:number,string,array,object,给出如下数据结构的定义:

////////////////////////////////////////////////////////////////////////////////
/// @brief JSON值
////////////////////////////////////////////////////////////////////////////////
class JsonValue
{
    friend class JsonString;
    friend class JsonList;
    friend class JsonDict;
    friend class Json;
protected:
    JSONVALUETYPE m_Type;  ///< @brief JSON对象类型
    /// @brief 数据域
    union
    {
        bool m_ValueBool;     ///< @brief 逻辑型
        double m_ValueNumber; ///< @brief 数字型
    };
public:
    /// @brief      写到字符串
    /// @param[out] OutStr 输出的目的字符串
    virtual void writeToStr(std::string& OutStr);
public: //用于接口转换
    virtual JsonString* toString();   ///< @brief 转换到字符串
    virtual JsonList* toList();       ///< @brief 转换到数组
    virtual JsonDict* toDict();       ///< @brief 转换到字典
public: //类型转换
    JSONVALUETYPE getType();       ///< @brief 返回类型

    bool toNull();                 ///< @brief 转换到NULL
    ///< @note  true表示NULL,false表示非NULL
    bool toBool();                 ///< @brief 转换到Bool
    ///< @note  true表示true,false表示非false
    double toNumber();             ///< @brief 到数字
    ///< @brief 非Number型用0表示
public: // 值类型操作,非值类型返回false
    bool setValue();                 ///< @brief 设置为NULL
    ///< @return 如果对象不是值类型,则返回假
    bool setValue(bool Value);         ///< @brief 设置为bool
    ///< @return 如果对象不是值类型,则返回假
    bool setValue(double Value);     ///< @brief 设置为数字
    ///< @return 如果对象不是值类型,则返回假
public: // 用于手动创建
    JsonValue();                       ///< @brief 创建为null值类型
    JsonValue(bool Value);             ///< @brief 创建为bool值类型
    JsonValue(double Value);           ///< @brief 创建为数值类型
    JsonValue(JSONVALUETYPE Type);     ///< @brief 创建为String/List/Dict
    virtual ~JsonValue();
};

////////////////////////////////////////////////////////////////////////////////
/// @brief JSON字符串
////////////////////////////////////////////////////////////////////////////////
class JsonString : public JsonValue
{
protected:
    std::string m_Str;   ///< @brief 字符串字面值
public:
    void writeToStr(std::string& OutStr);
public: //用于接口转换
    JsonString* toString();   ///< @brief 转换到字符串
public:
    std::string getStr();           ///< @brief 获得字符串
    void setStr(std::string Value); ///< @brief 设置字符串
public:
    /// @brief     构造函数
    /// @param[in] Value 字符串值
    JsonString(std::string Value);
    ~JsonString();
};

////////////////////////////////////////////////////////////////////////////////
/// @brief JSON数组
/// @note  JsonList将会负责销毁子对象
////////////////////////////////////////////////////////////////////////////////
class JsonList : public JsonValue
{
protected:
    std::vector<JsonValue*> m_ObjList;   ///< @brief 内部数组
public:
    void writeToStr(std::string& OutStr);
public: //用于接口转换
    JsonList* toList();       ///< @brief 转换到数组

public:
    /// @brief     获得对象
    /// @param[in] Index 索引
    /// @return    如果索引不存在返回NULL,否则返回对象指针
    JsonValue* getValue(int Index);

    /// @brief     设置对象
    /// @param[in] Index 索引
    /// @param[in] pNew  对象指针
    /// @return    返回操作是否成功
    bool setValue(int Index, JsonValue* pNew);

    /// @brief     往数组末端追加对象
    /// @param[in] pNew 对象指针
    void append(JsonValue* pNew);

    /// @brief 清空
    void clear();

    /// @brief 返回对象数量
    int getCount();
public:
    /// @brief 构造函数
    JsonList();
    ~JsonList();
};

////////////////////////////////////////////////////////////////////////////////
/// @brief JSON字典
////////////////////////////////////////////////////////////////////////////////
class JsonDict : public JsonValue
{
protected:
    std::vector<std::string> m_ObjList;                      ///< @brief 对象数组
    std::unordered_map<std::string, JsonValue*> m_Cache;  ///< @brief 对象字典缓存
public:
    void writeToStr(std::string& OutStr);
public: //用于接口转换
    JsonDict* toDict();       ///< @brief 转换到字典
public:
    /// @brief      返回对象
    /// @param[in]  Index 对象索引
    /// @param[out] pKeyOut 键
    /// @return     返回对象指针,若索引越界返回NULL
    JsonValue* getValue(int Index, std::string* pKeyOut = NULL);

    /// @brief     返回对象
    /// @param[in] Name 对象键名
    /// @return    返回对象指针,若不存在对象返回NULL
    JsonValue* getValue(std::string Name);

    /// @brief     设置对象
    /// @note      如果对象已经存在则会释放原有对象
    /// @param[in] Name 对象键名
    /// @param[in] pNew 对象指针
    void setValue(std::string Name, JsonValue* pNew);

    /// @brief     是否包含对象
    /// @param[in] Name 对象的键名
    /// @return    true=包含对象,false=没包含对象
    bool contain(std::string Name);

    /// @brief     移除对象
    /// @param[in] Index 对象键名
    /// @return    true=成功,false=失败
    bool remove(std::string Index);

    /// @brief 清空
    void clear();

    /// @brief 返回元素个数
    int getCount();
public:
    /// @brief 构造函数
    JsonDict();
    ~JsonDict();
};

开始解析JSON

解析string:

根据上图中string的状态转换图可以实现string数据类型的解析。同理可以实现数组,对象的解析。

JsonString* Json::parseString(Reader& Context)  ///< @brief 解析一个字符串
{
    std::string tRet;
    Context.match(‘"‘, true);
    char tChar;
    while ((tChar = Context.readChar()) != ‘"‘)
    {
        if (iscntrl(tChar))
        {
            throw ReaderException("Json::parseString", "Unexpected char.", Context.getLine(), Context.getRow());
        }

        if (tChar == ‘\\‘)
        {
            tChar = Context.readChar();
            switch (tChar)
            {
            case ‘"‘:
                tRet += "\"";
                break;
            case ‘\\‘:
                tRet += "\\";
                break;
            case ‘/‘:
                tRet += "/";
                break;
            case ‘b‘:
                tRet += "\b";
                break;
            case ‘f‘:
                tRet += "\f";
                break;
            case ‘n‘:
                tRet += "\n";
                break;
            case ‘r‘:
                tRet += "\r";
                break;
            case ‘t‘:
                tRet += "\t";
                break;
            case ‘u‘:
                throw ReaderException("Json::parseString", "Unexpected char.", Context.getLine(), Context.getRow());
                break;
            default:
            {
                throw ReaderException("Json::parseString", "Unexpected char.", Context.getLine(), Context.getRow());
                break;
            }
            }
        }
        else
        {
            tRet += tChar;
        }
    }
    return new JsonString(tRet.c_str());
}

完整代码已经发布在github上,如感兴趣可以参考学习;水平有限,如有不足,还请批评指正。

贴上项目地址:https://github.com/yongssu/json

时间: 2024-08-09 10:34:30

JSON解析器实现(C++)的相关文章

ASP.NET万能JSON解析器

ASP.NET万能JSON解析器 概念介绍还是先简单说说Json的一些例子吧.注意,以下概念是我自己定义的,可以参考.net里面的TYPE的模型设计如果有争议,欢迎提出来探讨!1.最简单:{"total":0} total就是值,值是数值,等于02. 复杂点{"total":0,"data":{"377149574" : 1}}total是值,data是对象,这个对象包含了"377149574"这个值,等于

Spring MVC4设置使用fastjson作为json解析器,替代jackson

不论是性能.易用性.特性支持,fastjson都要远好于默认的jackson,所以如果应用程序经常使用ajax进行数据交互,建议用fastjson作为默认解析器,只需要简单配置: <mvc:annotation-driven>   <mvc:message-converters register-defaults="true">     <bean class="com.alibaba.fastjson.support.spring.FastJs

如何编写一个JSON解析器

编写一个JSON解析器实际上就是一个函数,它的输入是一个表示JSON的字符串,输出是结构化的对应到语言本身的数据结构. 和XML相比,JSON本身结构非常简单,并且仅有几种数据类型,以Java为例,对应的数据结构是: "string":Java的String: number:Java的Long或Double: true/false:Java的Boolean: null:Java的null: [array]:Java的List<Object>或Object[]: {"

JSON解析器--实现代码

JSON解析器-实现方案 javascript对象表示法(javascript Object Notation,简称JSON)是一个轻量级的数据交换格式,他是基于js的对象字面量表示法. 经过长期的学习和使用,参考相关书籍,编写了一个JSON解析器: 即将它封装成了一个插件  文件名:json_parse.js,如下: var json_parse =function () { //这是一个能json文本解析成js数据结构的函数 //递归降序的解析器 //我们在零一个函数中定义此函数,以避免创建

高性能JSON解析器及生成器RapidJSON

RapidJSON是腾讯公司开源的一个C++的高性能的JSON解析器及生成器,同时支持SAX/DOM风格的API. 直击现场 RapidJSON是腾讯公司开源的一个C++的高性能的JSON解析器及生成器,同时支持SAX/DOM风格的API. 项目源码地址: Github托管:https://github.com/TencentOpen/rapidjson CODE托管:https://code.csdn.net/Tencent/rapidjson RapidJSON的灵感来自RapidXml,它

一起写一个JSON解析器

[本篇博文会介绍JSON解析的原理与实现,并一步一步写出来一个简单但实用的JSON解析器,项目地址:SimpleJSON.希望通过这篇博文,能让我们以后与JSON打交道时更加得心应手.由于个人水平有限,叙述中难免存在不准确或是不清晰的地方,希望大家可以指正:)] 一.JSON解析器介绍 相信大家在平时的开发中没少与JSON打交道,那么我们平常使用的一些JSON解析库都为我们做了哪些工作呢?这里我们以知乎日报API返回的JSON数据来介绍一下两个主流JSON解析库的用法.我们对地址 http://

这个东西,写C++插件的可以用到。 RapidJSON —— C++ 快速 JSON 解析器和生成器

原文: RapidJSON —— C++ 快速 JSON 解析器和生成器 时间 2015-04-05 07:33:33  开源中国新闻原文  http://www.oschina.net/p/rapidjson 4月18日 武汉 源创会开始报名,送华为开发板 Rapidjson 是一个 C++ 的快速 JSON 解析器和生成器,使用 SAX/DOM 风格的 API 设计. 示例代码: // rapidjson/example/simpledom/simpledom.cpp` #include "

自己动手实现一个简单的JSON解析器

1. 背景 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式.相对于另一种数据交换格式 XML,JSON 有着诸多优点.比如易读性更好,占用空间更少等.在 web 应用开发领域内,得益于 JavaScript 对 JSON 提供的良好支持,JSON 要比 XML 更受开发人员青睐.所以作为开发人员,如果有兴趣的话,还是应该深入了解一下 JSON 相关的知识.本着探究 JSON 原理的目的,我将会在这篇文章中详细向大家介绍一个简单的JSON解析器的解析流

&lt;JavaScript语言精粹&gt;JSON解析器源码阅读

1 // 这是一个用JavaScript编写JSON解析器的实现方案: 2 var jsonParser = (function() { 3 // 这是一个能把JSON文本解析成JavaScript数据结构的函数. 4 // 它是一个简单的递归降序解析器. 5 // 我们在另一个函数中定义此函数,以避免创建全局变量. 6 7 var at, // 当前字符索引 8 ch, // 当前字符 9 escapee = { 10 '"': '"', 11 "\\": &qu

.Net Core 3.0原生Json解析器

微软官方博客中描述了为什么构造了全新的Json解析器而不是继续使用行业准则Json.Net 微软博客地址:https://devblogs.microsoft.com/dotnet/try-the-new-system-text-json-apis/ 在官方的Github中,也有关于此问题的详细描述:https://github.com/dotnet/corefx/issues/33115 简单说明就是.Net Core有一个Span<T>类,它类似于数组,但它不托管于堆上,因此提供了操作内存