C++读入XML文件

最近要做一个VRP的算法,测试集都是放在Xml文件中,而我的算法使用C++来写,所以需要用C++来读取Xml文件。

在百度上搜“C++读取Xml文件”,可以出来很多博客,大多数是关于tinyXml的,所以这篇博文也是讲述如何用tinyXML来读取XML文件。

有些内容可能参考到了@marchtea的博文《C++读取XML,tinyXml的使用》:http://www.cnblogs.com/marchtea/archive/2012/11/08/2760593.html。

tinyXml是一个免费开源的C++库,可以到官网上下载:https://sourceforge.net/projects/tinyxml/。

下载下来解压之后,可以看到下面这些文件:

我是在windows下用VS来写C++的,按照@marchtea的说法,只需要直接打开tinyxml.sln就可以,不过我还是用了笨办法:

  • 把tinystr.cpp, tinyxml.cpp, tinyxmlerror.cpp, tinyxmlparser.cpp, tinystr.h, tinyxml.h拷贝到工程目录下;
  • 然后加入头文件引用:#include "tinystr.h"   #include "tinyxml.h"。

接下来就来分享一下我读取VRP问题中的solomon benchmark的方法,这些方法都是参考自tinyXml的官方教程,在下载的文件夹中有"doc"子文件夹,打开它,有一个叫做"tutorial0"的html文件,打开它可以看到详细的教程。

OK,now begins!

我要读取的Xml文件有如下的格式(只列举部分):

<!-- 要读取的Xml文件 -->
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<instance>
    <network>
        <nodes>
            <node id="0" type="0">
                <cx>40.0</cx>
                <cy>50.0</cy>
            </node>
        <!--  有N+1个这样的node节点 -->
        </nodes>
    </network>
    <requests>
        <request id="1" node="1">
            <tw>
                <start>145</start>
                <end>175</end>
            </tw>
            <quantity>20.0</quantity>
            <service_time>10.0</service_time>
        </request>
        <!-- 有N个这样的request节点 -->
    </requests>
</instance>    

这里稍微解释一下为什么nodes节点的数目会比requests节点多1个。这是因为nodes节点包括了顾客节点(N个)和仓库节点(1个),而requests属性只属于顾客节点。

我是把xml文件中的这些数据读入到类对象数组中,每个类对象代表一个节点,类的定义如下:

// Customer.h
#ifndef _Customer_H
#define _Customer_H

class Customer{
public:
	Customer(int id=0, float x=0, float y=0, float startTime=0, float endTime=0, float quantity=0, float serviceTime=0);
	void setId(int id);   // 设置成员id的值
	void setX(float x);   // 设置成员x的值
	void setY(float y);   // 设置成员y的值
	void setStartTime(float startTime);  // 设置成员startTime的值
	void setEndTime(float endTime);      // 设置成员endTime的值
	void setQuantity(float quantity);    // 设置成员quantity的值
	void setServiceTime(float serviceTime);  // 设置成员serviceTime的值
	void show();  // 显示顾客节点信息
private:
	int id;
	float x;
	float y;
	float startTime;
	float endTime;
	float quantity;
	float serviceTime;
};

#endif

OK,那么现在开始贴一下main.cpp代码(Customer.cpp比较简单,就不贴了)

// main.cpp
#include "Customer.h"
#include "tinystr.h"
#include "tinyxml.h"
#include<iostream>
#include<vector>
#include<string>
#include<stdlib.h>
#include<iomanip>

using namespace std;
static const int NUM_OF_CUSTOMER = 51;        //顾客数量
static const char* FILENAME = "RC101_050.xml";  //文件名

int main(){
	vector<Customer *> customerSet(0);  // 顾客集,每个元素是Customer对象的指针
	int i,j,k,count;
	int temp1;    // 存放整型数据
	float temp2;  // 存放浮点型数据
	Customer* customer;   // 临时顾客节点指针
	for (i=0; i<NUM_OF_CUSTOMER; i++) {  // 先初始化顾客集
		customer = new Customer();
		customerSet.push_back(customer);
	}
	TiXmlDocument doc(FILENAME);    // 读入XML文件
	if(!doc.LoadFile()) return -1;  // 如果无法读取文件,则返回
	TiXmlHandle hDoc(&doc);         // hDoc是&doc指向的对象
	TiXmlElement* pElem;            // 指向元素的指针
	pElem = hDoc.FirstChildElement().Element(); //指向根节点
	TiXmlHandle hRoot(pElem);       // hRoot是根节点

	// 读取x,y,它们放在network->nodes->node节点中
	TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //当前指向了node节点
	count = 0;  // 记录移动到了哪个node节点,并且把该node节点的信息录入到顺序对应的customer中
	for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) { // 挨个读取node节点的信息
		customer = customerSet[count];  // 当前顾客节点,注意不能赋值给一个新的对象,否则会调用复制构造函数
		TiXmlHandle node(nodeElem);  // nodeElem所指向的节点
		TiXmlElement* xElem = node.FirstChild("cx").Element();  // cx节点
		TiXmlElement* yElem = node.FirstChild("cy").Element();  // cy节点
		nodeElem->QueryIntAttribute("id", &temp1);  //把id放到temp1中,属性值读法
		customer->setId(temp1);
		temp2 = atof(xElem->GetText());    // char转float
		customer->setX(temp2);
		temp2 = atof(yElem->GetText());
		customer->setY(temp2);
		count++;
	}

	// 读取其余信息
	TiXmlElement* requestElem = hRoot.FirstChild("requests").FirstChild("request").Element(); // 指向了request节点
	count = 1;
	for(requestElem; requestElem; requestElem = requestElem->NextSiblingElement()) {
		customer = customerSet[count];     // 当前顾客节点,注意不能赋值给一个新的对象,否则会调用复制构造函数
		TiXmlHandle request(requestElem);  // 指针指向的对象
		TiXmlElement* startTimeElem = request.FirstChild("tw").FirstChild("start").Element(); // start time
		TiXmlElement* endTimeElem = request.FirstChild("tw").FirstChild("end").Element();     // end time
		TiXmlElement* quantityElem = request.FirstChild("quantity").Element();                // quantity
		TiXmlElement* serviceTimeElem = request.FirstChild("service_time").Element();         // service time
		// 分别读取各项数据
		temp2 = atof(startTimeElem->GetText());
		customer->setStartTime(temp2);
		temp2 = atof(endTimeElem->GetText());
		customer->setEndTime(temp2);
		temp2 = atof(quantityElem->GetText());
		customer->setQuantity(temp2);
		temp2 = atof(serviceTimeElem->GetText());
		customer->setServiceTime(temp2);
		count++;
	}

	// 将读取到的信息输出到控制台
	cout<<setiosflags(ios_base::left)<<setw(6)<<"id"<<setw(6)<<"x"<<setw(6)<<
		"y"<<setw(12)<<"startTime"<<setw(12)<<"endTime"<<setw(12)<<"quantity"<<setw(14)<<"serviceTime"<<endl;
	for(i=0; i<NUM_OF_CUSTOMER; i++) {
		customer = customerSet[i];
		customer->show();
	}
	system("pause");
	return 0;
}

  

在解释main.cpp的内容之前,先解释一下一些数据类型(只是个人理解,欢迎纠错):

  • TiXmlDocument:文件节点,把Xml文件的内容读入到该类型变量中
  • TiXmlElement*:指向节点的指针
  • TiXmlHandle:节点的实例,也就是TiXmlElement所指向的对象
  • FirstChild("nodeName"):第一个名字为“nodeName”的子节点
  • NextSiblingElement():下一个兄弟节点元素,它们有相同的父节点
  • QueryIntAttribute("attributeName", &var):把节点属性名为attributeName的属性值以int类型赋值给var变量
  • GetText():获取当前节点元素的内容,即包含在<node>text</node>中的text

OK,有了以上一些简单的知识积累,就可以很方便地读取Xml文件了,现在截取xml的部分来讲解:

<instance>
    <network>
        <nodes>
            <node id="0" type="0">
                <cx>40.0</cx>
                <cy>50.0</cy>
            </node>
        <!--  有N+1个这样的node节点 -->
        </nodes>
    </network>
    .....
</instance>

在这部分我们会把顾客的id,坐标x,y都读入到Customer对象中。 

1. 首先我们得到了文件节点hDoc,现在我们要进入根节点"instance":

TiXmlElement* pElem;            // 指向元素的指针
pElem = hDoc.FirstChildElement().Element(); //指向根节点
TiXmlHandle hRoot(pElem);       // hRoot是根节点

根节点"instance"是文件节点的第一个子节点,所以用 pElem = hDoc.FirstChildElement().Element() 就可以使得指针pElem指向"instance",hRoot是pElem所指向的对象。

2. 现在我们需要进入到“node”节点中,遍历其兄弟节点,将所有数据读入。下面的语句可以将第一个“node”节点的指针赋值给nodeElem:

TiXmlElement* nodeElem = hRoot.FirstChild("network").FirstChild("nodes").FirstChild("node").Element(); //当前指向了node节点

节点的id值放在"node"节点的属性"id"中:

nodeElem->QueryIntAttribute("id", &temp1);  //把id放到temp1中,属性值读法

然后坐标x, y的值放在“node”节点的子节点"cx"和"cy"的内容(text)中,所以我们这样来读取:

TiXmlElement* xElem = node.FirstChild("cx").Element();  // cx节点
temp2 = atof(xElem->GetText());    // char转float

函数atof在库<stdlib>中,用以将char数组转化为浮点数。

通过1,2两步,我们已经把第一个“node”节点的id, x, y的值读入到对象中,然后只需要把遍历所有的兄弟节点即可:

for(nodeElem; nodeElem; nodeElem = nodeElem->NextSiblingElement()) {
......
}

读入requests节点下的startTime, endTime, quantity, serviceTime等值的方法也是一样的,详情参考main.cpp代码。

运行结果如下:

总结:

其实说白了读取Xml文件的关键在于:

  • 移动指针到所要读取数据的节点中; 
  • 若是读取属性值,则使用QueryIntAttribute方法直接读取;
  • 若读取的是节点的内容,则使用getText()方法读取;
  • 连续的数据具有兄弟节点关系,使用NextSiblingElement()方法来指向下一个兄弟节点

后记:

这篇博文只介绍了如何读取Xml文件,至于如何写入Xml文件,请参考tinyXml的官方教程,讲的特别清楚,特别良心。

希望大家看了之后有所收获,欢迎交流。

  

  

 

  

时间: 2024-10-30 22:09:22

C++读入XML文件的相关文章

将字符串以用二进制流的形式读入XML文件

其实将字符串写入XML文件本身并不复杂,这里只是写一些需要注意的地方,特别是编码格式,这里需要的是XML默认的编码方式是UTF-8,在对字符串进行编码的时候一定要注意, string strReceiveData = srs.ReceiveData(); byte[] data = Encoding.UTF8.GetBytes(strReceiveData); //将当前的字符串保存到XML文件中 System.IO.FileStream stream = new FileStream(Syst

[学习手记] Java中利用DOM方法解析XML文件

需求分析: 在做一个利用API的小东西时需要对返回的XML格式的数据进行解析 详见文章: [开发手记] 一款基于命令行的英英词典 (A CLI-Based EE Dictionary) 项目地址: https://github.com/hwding/seekDict 准备工作: 阅读Documentation 查阅相关代码 读入XML文件到程序内: 首先用DocumentBuilderFactory生成一个DocumentBuilder实例 DocumentBuilder docmumentBu

matlab xml文件交互

xml文件以文档对象模型表示,简称DOM(Document Object Model).在Matlab中,使用xmlread读取xml文件成DOM节点,对xml文件的操作转化成对DOM节点的操作,使用xmlwrite把DOM节点写入到xml文件中. Matlab写xml文件以个人信息为例,通常个人的信息包括姓名.性别.住址和电话等等,其中电话可能有多个,比如手机和座机,代码如下. % file namefilename = 'info'; % create documentdocNode = c

转载:用Ant操作XML文件

1.14 用XMLTask操作XML(1) 本节作者:Brian Agnew 对于简单的文本搜索和替换操作,Ant的<replace>任务就够用了,但在现代Java框架中,用户更可能需要强大的XML操作能力来修改servlet描述符.Spring配置等. XMLTask是Ant外部任务,它提供了强大的XML编辑工具,主要用于在构建/部署过程中创建和修改XML文件. 使用XMLTask的好处如下? 与Ant的<replace>任务不同,XMLTask使用XPath提供识别XML文档各

Qt Write and Read XML File 读写XML文件

在Qt中,我们有时候需要把一些参数写入xml文件,方便以后可以读入,类似一种存档读档的操作,例如,我们想生成如下的xml文件: <?xml version="1.0" encoding="UTF-8"?> <Parameters> <para1>1</para1> <para2>2</para2> <para3>3</para3> </Parameters>

解析XML文件的两种方式 SAX和DOM

1.数据解析 解析的基本概念 所谓“解析”:从事先规定好的格式中提取数据 解析的前提:提前约定好格式,数据提供方按照格式提供数据.数据获取方则按照格式获取数据 iOS开发常见的解析:XML解析.JSON解析 2.XML数据结构 XML:Extensible Markup language(可扩展标记语言),主流数据格式之一,可以用来存储和传输数据. XML数据格式的功能 数据交换 内容管理 用作配置文件 XML数据结构的语法 声明 节点使用一对标签表示:起始和结束标签. 根节点是起始节点,只有一

boost::property_tree读取解析.xml文件

1)read_xml 支持中文路径  boost::property_tree::wptree wpt;    std::locale::global(std::locale(""));    boost::property_tree::xml_parser::read_xml("E:\\测试\\test.xml",wpt); 2)get  ptree pt;    read_xml("D://test1.xml",pt); //读入一个xml文

【java项目实战】dom4j解析xml文件,连接Oracle数据库

简介 dom4j是由dom4j.org出品的一个开源XML解析包.这句话太官方,我们还是看一下官方给出的解释.如下图: dom4j是一个易于使用的.开源的,用于解析XML,XPath和XSLT等语言的库.它应用于Java平台,采用了Java集合框架并完全支持DOM,SAX和JAXP等编程标准. 特点 dom4j是一个非常非常优秀的Java XML API,具有性能优异.功能强大和极端易用的特点,同时它也是一个开放源代码的软件.如今你可以看到越来越多的Java软件都在使用dom4j来读写XML,例

【Java编程】SAX XML Parser解析、生成XML文件

1.优缺点 优点: SAX 从根本上解决了 DOM 在解析 XML 文档时产生的占用大量资源的问题.其实现是通过类似于流解析的技术,通读整个 XML 文档树,通过事件处理器来响应程序员对于 XML 数据解析的需求.由于其不需要将整个 XML 文档读入内存当中,它对系统资源的节省是十分显而易见的,它在一些需要处理大型 XML 文档以及性能要求较高的场合有起了十分重要的作用.支持 XPath 查询的 SAX 使得开发人员更加灵活,处理起 XML 来更加的得心应手. 缺点: 但是同时,其仍然有一些不足