C++读取XML,tinyXml的使用

前言:

  最近在开发的过程中,有个需求是对xml进行格式转化,从一种格式转化到另外一种格式.因此,就需要读取xml进行处理.原本打算写成工具在linux下运行,不过后来考虑到和系统结合,最后也就使用了前台js转了.反正都是读取xml,什么技术转不都是一样的么?

  不过刚开始还是对要使用的技术做了一定的探究.c++要读取xml有很多种方式.比较又名的有:

  rapidXML(这个是网上介绍的,没用过)

  Xerces-C++ XML Parser: 通常来说,读取XML的方法都是将整个文本进行读取,然后构建成DOM Tree,之后进行遍历等操作.这个Parser除了支持构建DOM Tree的方式之外,还支持类似于回调函数的方式进行处理(SAX,SAX2).在读到相应的节点然后调用函数进行处理.DOM Tree的方式好处是简单,操作很方便,但是劣势也是很明显:需要把整个XML读进之后才能做处理.如果XML很大,那内存就支撑不住 了.SAX,SAX2的作用就在此.其可以支持很大的XML,因为其是相当于事件式的处理方式,不需要构建DOM Tree.不过就是比较麻烦.

  TinyXML: 这个就是接下来要介绍的库了.取名Tiny,意在编写一个轻量级的处理基本XML的工具.因此,其支持的特性有限.下面列出了其不支持的功能:

  TinyXML doesn‘t parse or use DTDs (Document Type Definitions) or XSLs (eXtensible Stylesheet Language.)

                                                           -------------------官方说明文档

  其给出的理由也很明确:

  1. 支持这两个特性使得库更为庞大

  2. 使用更为复杂

  3. 学习曲线更曲折

  需要使用这些特性的可以考虑上面的xerces-C++ XML Parser.很强大.当然也复杂得多

TinyXml使用:

  前言说的已经够多了,咱们就不废话了,直接讲解tinyXml的使用方法.

安装:

    TinyXml的安装方法并不复杂,或者说没有安装这个步骤.

    1. 下载tinyXml ,下载tinyxml_2_6_2.zip

    2. 解压unzip tinyxml_2_6_2.zip.(windows就直接解压就可以了)

    

    对于有vs的朋友来说,直接打开tinyxml.sln就可以了.对于linux用户来说,则需要拷贝上面全出来的6个文件.

    PS.顺带的,我觉得可以把它的Makefile也拷出来.写得非常不错.可以参考参考.

  使用:

    tinyxml的使用方法很简单,只需要把拷出来的文件放在自己编写的目录下面,引用tinyxml.h,tinystr.h即可.

    简单示例代码:

    

 1 #include "tinyxml.h"
 2 #include "tinystr.h"
 3 #include <iostream>
 4
 5 using namespace std;
 6 int main(int argc, char *argv[])
 7 {
 8         if(argc != 2)
 9         {
10                 cout << "usage: "<<argv[0] << " xmlfile" << endl;
11                 return 1;
12         }
13         TiXmlDocument doc(argv[1]);
14         bool loadOk = doc.LoadFile();
15         if (!loadOk)
16         {
17                 cout << "could load:" << doc.ErrorDesc() << endl;
18         }
19         TiXmlPrinter printer;//提供的工具类,目的是将xml的数据按格式输出
20         doc.Accept(&printer);
21         cout  << printer.CStr() << endl;//输出
22
23         TiXmlElement*node = doc.FirstChildElement();//获取第一个element节点
24         cout << node->Value() << endl;//输出节点的值
25         string t;
26          node->QueryValueAttribute("type", &t);//获取节点属性
27          cout << t << endl;
28
29                  doc.FirstChild()->NextSibling()->ToElement()->QueryStringAttribute("type", &t);//获取第二个子节点的数据
30          cout << "2:" << t << endl;
31
32         //使用遍历的方式进行处理
33         TiXmlNode* child = NULL;
34         TiXmlElement* element = NULL;
35         TiXmlAttribute *attr = NULL;
36         int ct;
37         while(child = doc.FirstChild()->IterateChildren(child))
38         {
39                 cout << child->ValueStr() << "\t";
40                 ct = child->Type();
41                 cout << ct << "\t";
42                 //根据不同的节点类型做相应处理
43                 switch(ct)
44                 {
45                         case TiXmlNode::TINYXML_TEXT:
46                                 break;
47                         case TiXmlNode::TINYXML_ELEMENT:
48                                 element = child->ToElement();
49                                 attr = element->FirstAttribute();
50                                 while(attr)
51                                 {
52                                         cout << attr->NameTStr() << "=" << attr->ValueStr() << ‘\t‘;
53                                         attr = attr->Next();
54                                 }
55                                 break;
56                 }
57         }
58
59         return 0;
60 }    

编译命令:

g++ -c tinyxmlparser.cpp -DTIXML_USE_STL
g++ -c tinyxmlerror.cpp -DTIXML_USE_STL
g++ -c tinystr.cpp -DTIXML_USE_STL
g++ -c tinyxml.cpp -DTIXML_USE_STL
g++ -c xmltest.cpp -DTIXML_USE_STL
g++ -o xmltest xmltest.o tinyxmlparser.o tinyxmlerror.o tinystr.o tinyxml.o 

或者大家可以参考那个Makefile改改.

xml文件:

<xml>
    <tag1 type=‘1‘/>
    <tag2 type=‘2‘/>
</xml>

运行结果:

<xml>
    <tag1 type="1" />
    <tag2 type="2" />
</xml>

xml

1:
tag1    1       type=1  tag2    1       type=2 

   没打回车显得比较混乱,将就这看看.

详细解释:

    这部分仅仅是我的理解,可能有错.有错的话还请告知我下.

    tinyxml按照xml的规定,将所有结点做了区分.我们也可以看到类库中有:

    TiXmlDocument:文档中的根

    TiXmlNode: node为文档中所有结点的父类型.其可以转化为其他的结点类型.

    TiXmlElement: element结点.即我们平常所使用的,具有属性,tagName的结点.

    TiXmlComment: 注释

    TiXmlText: 文字结点.

    TiXmlDeclaration: xml的声明(?xml version="1.0" standalone="yes"?>)

    TiXmlUnknown: 任何tinyXml不认的结点都将归结为unknown,在重新写回文件时,按照原样输出.

    一般我们的操作仅仅在于,取tagName,获取属性,获取文字,迭代.这里就讲下这些操作.

    tagName: 对于element来说,可以使用element->Value()或者element->ValueStr();//两者区别仅仅在于返回值不同,后者返回string.

对于Value()函数来说,文档上也解释了,对于不同的结点,返回值不同.

		Document:	filename of the xml file
		Element:	name of the element
		Comment:	the comment text
		Unknown:	the tag contents
		Text:		the text string

    获取属性:获取属性有多种方式.最简单的是采用const char* Attrubute(const char *),或者采用QueryValueAttribute (const std::string &name, T *outValue) const.还有获取相应类型,如Int,double等的函数.可以自己查看手册.有时候需要遍历属性时,可以这么写

TiXmlAttribute *attr = NULL;
attr = element->FirstAttribute();
while(attr)
{
      cout << attr->NameTStr() << "=" << attr->ValueStr();
      attr = attr->Next();
}

    获取文字:element->GetText();

    迭代:

TiXmlNode *child = NULL;
while(child = parent->IterateChildren(child))
{
    cout << child->ValueStr() << endl;
}

总结:

  对于TinyXml的介绍大致到这.还有很多细节还没叙述,不过可以看看文档,下的源码包里头就有doc,很方便,讲的也很详细.

有什么问题可以随时讨论.欢迎留言哈.

时间: 2024-10-12 15:18:46

C++读取XML,tinyXml的使用的相关文章

android XMLPullParser读取xml文件

由于刚学Android,用的开发工具是Android studio,没用过eclipse的那个开发Android,所以针对有些说由于2个IDE的路径不通导致的文件读取不到,不做分析(实际上是没法分析eclipse里的),这个博文只针对AS用户. 我们的资源文件,除了放到res目录下之外,还可以放在跟java .res同级的asserts(新建的)目录里. 今天要解析的这个xml就是在这个目录下的. 首先说一下xmlpullparser,这个pull解析是基于事件的模式.比如 读取到xml的开始声

C#读取XML文件的基类实现

刚到新单位,学习他们的源代码,代码里读写系统配置文件的XML代码比较老套,直接写在一个系统配置类里,没有进行类的拆分,造成类很庞大,同时,操作XML的读写操作都是使用SetAttribute和node.Attribute(name)方法,因此,想到结合之前所做的XML操作,完成了一个能够读取XML文件的基类,便于以后的使用. PS:即使再老套的代码,目前也不敢进行优化,一是水平不行,二是不敢. 使用静态扩展类,扩展了几个经常使用的类型,能够方便数据的读写. 操作XML的类,可以直接继承BaseL

【XML配置文件读取】使用jdom读取XML配置文件信息

在项目中我们经常需要将配置信息写在配置文件中,而XML配置文件是常用的格式. 下面将介绍如何通过jdom来读取xml配置文件信息. 配置文件信息 <?xml version="1.0" encoding="UTF-8"?> <config> <base-config> <stringValue>Hello world</stringValue> <integerValue>8</integ

C#中使用XML指南之读取XML

? C#中使用XML指南之读取XML ? 访问的两种模型: ? 在程序中访问进而操作XML文件一般有两种模型,分别是使用DOM(文档对象模型)和流模型,使用DOM的好处在于它允许编辑和更新XML文档,可以随机访问文档中的数据,可以使用XPath查询,但是,DOM的缺点在于它需要一次性的加载整个文档到内存中,对于大型的文档,这会造成资源问题.流模型很好的解决了这个问题,因为它对XML文件的访问采用的是流的概念,也就是说,任何时候在内存中只有当前节点,但它也有它的不足,它是只读的,仅向前的,不能在文

用C#读取XML文档

本文将以一个非常简单的例子来说明如何使用C#访问一个XML文件并且读取其中的信息.例子本身并无任何实际意义,它只是简单的介绍了如何调用微软的XML标准以及如何运用到实际当中去.希望能够对初次接触C#或者未尝试过通过C#读取XML文件的读者有所启发.本文旨在抛砖引玉,希望能与更多的朋友交流和分享经验.    制作过程 1. 运行Visual Studio.NET,新建Visual C#.NET工程,这里取名为ReadXML. 2. 在解决方案资源管理器中,将Form1.cs改名为frmAuthor

读取xml并将节点保存到Excal

using NPOI.HPSF; using NPOI.HSSF.UserModel; using NPOI.SS.UserModel; using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.IO; using System.Linq; using System.Text; using Sy

Excel开发学习笔记:读取xml文件及csv文件

读取xml文件 有好多种读取xml的方式,xmlDOM比较常见,我使用了另外一种,它以数据流的方式打开文件并读取内容 Imports System.Xml  Dim group As New List(Of String)  Using reader As XmlReader = XmlReader.Create(OpenFileDialog2.FileName)      While reader.ReadToFollowing("group")          reader.Mo

C# 递归读取XML菜单数据

在博客园注册了有4年了,很遗憾至今仍未发表过博客,趁周末有空发表第一篇博客.小生不才,在此献丑了! 最近在研究一些关于C#的一些技术,纵观之前的开发项目的经验,做系统时显示系统菜单的功能总是喜欢把数据写在数据库表,然后直接读取加载到菜单树上显示. 现在想把菜单数据都放在XML里,然后递归读取XML. 由于项目使用WCF,实体类使用了两个,一个是业务逻辑层中的实体,一个是调用业务逻辑层递归方法后进行数据实体的转换,XML读取方法写在业务逻辑层中. 思路:1.先读取XML里所有的菜单    2.根据

android 读取xml

在有些应用中,有一点小数据,直接存储在XML就是,实现较为简单, 1.xml文件放入asset文件夹,结构如: <?xml version="1.0" encoding="UTF-8" ?> <messages><message id="1"><title>3月毕业证数码像采集</title><date1>3</date1><content>3月12日