boost.property_tree读取中文乱码问题正确的解决方式

开发项目的时候在使用boost,在宽字符下遇到中文乱码问题

上网上看大家都是先转成utf8在进行解析的,例如:

http://blog.csdn.net/hu_jiangan/article/details/49945373 中

void Init(const wstring& fileName, wptree& ptree)
{
  std::wifstream f(fileName);
  std::locale utf8Locale(std::locale(), new std::codecvt_utf8<wchar_t>);
  f.imbue(utf8Locale); //先转换一下
  //用wptree去解析
  property_tree::read_xml(f, ptree);
}

  他的思路没有问题,并且还用了STL库,避免了boost的繁琐。

但是在boost中对read_xml定义里包含了对xml的转换

 1 template<class Ptree>
 2     void read_xml(const std::string &filename,
 3                   Ptree &pt,
 4                   int flags = 0,
 5                   const std::locale &loc = std::locale())
 6     {
 7         BOOST_ASSERT(validate_flags(flags));
 8         std::basic_ifstream<typename Ptree::key_type::value_type>
 9             stream(filename.c_str());
10         if (!stream)
11             BOOST_PROPERTY_TREE_THROW(xml_parser_error(
12                 "cannot open file", filename, 0));
13         stream.imbue(loc);
14         read_xml_internal(stream, pt, flags, filename);
15     }

所以他对xml进行了两次utf8的转换
正确的代码其实只需要两行就可以完成

void Init(const wstring& fileName, wptree& ptree)
{
  std::locale utf8Locale(std::locale(), new std::codecvt_utf8<wchar_t>);
  boost::property_tree::read_xml(filename, ptree, 0, utf8Locale);
}
时间: 2024-08-02 01:03:34

boost.property_tree读取中文乱码问题正确的解决方式的相关文章

boost::property_tree读取解析.xml文件

1)read_xml 支持中文路径  boost::property_tree::wptree wpt;    std::locale::global(std::locale(""));    boost::property_tree::xml_parser::read_xml("E:\\测试\\test.xml",wpt); 2)get  ptree pt;    read_xml("D://test1.xml",pt); //读入一个xml文

C++ 中使用boost::property_tree读取解析ini文件

boost 官网 http://www.boost.org/ 下载页面 http://sourceforge.net/projects/boost/files/boost/1.53.0/ 我下载的是 boost_1_53_0.tar.gz 使用系统  ubuntu 12.10 一.解压 [plain] view plaincopy tar -zxvf  boost_1_53_0.tar.gz 得到一个文件夹 boost_1_53_0,  拷贝其子目录 boost 到以下路径 [plain] vi

boost::property_tree读取解析ini文件--推荐

boost::property_tree读取解析ini文件 [cpp] view plaincopy #include "stdafx.h" #include <iostream> #include <boost/property_tree/ptree.hpp> #include <boost/property_tree/ini_parser.hpp> int main() { boost::property_tree::ptree pt; boos

File.ReadAllText&nbsp;读取中文乱码问题

原文:File.ReadAllText 读取中文乱码问题 用 File.ReadAllText(filepath)   去读取中文txt文件会遇到乱码问题,我自己测试了一下,ANSI编码的txt才会出现这种问题,其他编码入utf-8.unicode不会出现这类问题,编码上面通过一个重载就可以搞定了 File.ReadAllText (path, Encoding.Default) System.Text.Encoding 命名空间下有各种编码,操作汉字的文件或流常要涉及到

InputStream 读取中文乱码 扩展

对于InputStream读取中文乱码,下面这段话给出了很好的解释,以及后续编码上的扩展. BufferedInputStream和BufferedOutputStream是过滤流,需要使用已存在的节点来构造. 即必须先有InputStream或OutputStream,相对直接读写,这两个流提供带缓存的读写,提高了系统读写效率性能. BufferedInputStream读取的是字节byte,因为一个汉字占两个字节,而当中英文混合的时候,有的字符占一个字节,有的字符占两个字节. 所以如果直接读

关于Android与pc通信时中文乱码的分析和解决

初步实现了Android与pc服务器的通信之后,又碰到了传说中令人头疼不已的中文乱码问题.既然出现了乱码,那么原因自然是协议不通了.我们知道eclipse中默认的编码标准是GBK,而安卓程序开发所默认的布局文件编码标准则是utf-8,这样一来,我们双方通信的时候便难免出现乱码.要解决它,就要从二者转换方面着手.     首先我们知道,从安卓手机界面上获得的文字,其编码字符集是utf-8,所以,当我们的java文件获得它时,它是以utf-8形式编译的.所以这里,在得到EditText中的文字之后,

php中文乱码问题分析及解决办法

中文乱码问题产生的原因,主要就是字符编码设置问题: 首先,mysql数据库安装的时候字符编码要选择正确,最好选择utf-8比较保险.如果安装时没有设置正确,找到mysql的安装目录,修改my.conf配置文件中的字符设置,打开文件,应该一个是在mysqll下面,一个是在server下面的. 如果是php页面的中文乱码,也就是非数据库查询出来的数据,HTML页面静态的部分出现乱码,应该使用header("content-type:text/html; charset=utf8") 来设定

关于c++与java中文乱码问题分析与解决

关于c++与java中文乱码问题分析与解决 DionysosLai([email protected])  2014/8/1 问题分析: 之所以会出现中文乱码问题,归根结底在于中文的编码与英文的编码方式存在差异. 在java内部是使用16bit的unicode编码(即utf-16)来表示字符串,无论英文还是中文都是2字节. C/C++使用的是原始数据,ascii是一个字节,中文一般是GB2312编码,用2个字节表示一个汉字. Jni内部是使用utf-8编码表示字符串的,utf-8是扁长的unic

文《关于c++与java中文乱码问题分析与解决》中一个bug分析

文<关于c++与java中文乱码问题分析与解决>中一个bug分析 DionysosLai([email protected]) 2014/10/21 在前几篇一博客<关于c++与java中文乱码问题分析与解决>,地址如下:http://blog.csdn.net/dionysos_lai/article/details/38389765.文中详细介绍了c++与java数据传递时,为何会出现中文乱码的原因,并提出了适当的解决方法.方法如下: int CCDirector::GBKTo