c++序列化方法

  1. 暂时使用boost 序列化, 目前我的测试基本都ok 只是对于c++11 shared ptr 没有测试成功,只能手工写下shared ptr 部分的序列化,也就是目前我对指针都不直接序列化,自己管理,例如下面样子

    Load_(modelFile); //model直接序列化

    string normalizerName = read_file(OBJ_NAME_PATH(_normalizer));

    if (!normalizerName.empty())

    { //由于没有利用shared ptr直接序列化,不知道具体信息,所以我save的时候写了normalzier类型名字到文本,load时候通过这个确定类型

    _normalizer = NormalizerFactory::CreateNormalizer(normalizerName, OBJ_PATH(_normalizer));

    }

    string calibratorName = read_file(OBJ_NAME_PATH(_calibrator));

    if (!calibratorName.empty())

    {

    _calibrator = CalibratorFactory::CreateCalibrator(calibratorName, OBJ_PATH(_calibrator));

    }

    static NormalizerPtr CreateNormalizer(string name)

    {

    boost::to_lower(name);

    if (name == "minmax" || name == "minmaxnormalizer")

    {

    return make_shared<MinMaxNormalizer>();

    }

    if (name == "gaussian" || name == "gaussiannormalizer")

    {

    return make_shared<GaussianNormalizer>();

    }

    if (name == "bin" || name == "binnormalizer")

    {

    return make_shared<BinNormalizer>();

    }

    LOG(WARNING) << name << " is not supported now, do not use normalzier, return nullptr";

    return nullptr;

    }

    ?
    ?

    static NormalizerPtr CreateNormalizer(string name, string path)

    {

    NormalizerPtr normalizer = CreateNormalizer(name);

    if (normalizer != nullptr)

    {

    normalizer->Load(path); //normalzier直接序列化

    }

    return normalizer;

    }

    ?
    ?

    @TODO 确认下是否没有办法直接序列化shared ptr,

    另外可以尝试下开源的专门序列化库creal,creal仿照boost 序列化 同时boost序列化只支持binary,文本,xml三种序列化,文本序列化可读性不强,binary速度最快,xml可读性最高速度慢一些。我一般只用binary和xml格式。而creal 支持json格式的输出,号称支持shared ptr

    ?
    ?

    同一个模型boost序列化速度


??


Binary


Text


Save


1.8


2.29


Load


1.9


2.67

?
?

?
?

  1. 如果需要xml输出,boost的序列化写法和只需要binary输出不一样,建议采用支持xml输出的写法这样互相都兼容。

    ?
    ?

    friend class boost::serialization::access;

    template<class Archive>

    void serialize(Archive &ar, const unsigned int version)

    {

    /*????????ar & boost::serialization::base_object<Predictor>(*this);

    ar & _weights;

    ar & _bias;*/ //这种写法只支持binary

    ar & BOOST_SERIALIZATION_BASE_OBJECT_NVP(Predictor);

    ar & BOOST_SERIALIZATION_NVP(_weights); //这样宏比较方便 如果需要改名字比如_weights->weights可以使用原函数

    ar & BOOST_SERIALIZATION_NVP(_bias);

    }

    ?
    ?

    ?
    ?

  2. 采用python脚本自动生成序列化部分的代码。因为和c#不一样 c#是默认都可以序列化,如果不需要序列化,你可以类似#define指定,而boost默认都不序列化,需要序列化的地方需要显示都写上

    Predictors]$ get-lines.py LinearPredictor.h 98 99 | gen-boost-seralize-xml.py

    ?
    ?

    friend class boost::serialization::access;

    template<class Archive>

    void serialize(Archive &ar, const unsigned int version)

    {

    ar & BOOST_SERIALIZATION_NVP(_weights);

    ar & BOOST_SERIALIZATION_NVP(_bias);

    }

    ?
    ?

4. 对于Predictor 默认是Save二进制,可选的SaveXml方式这个自动支持,可选的SaveText这个是特定的Precitor子类型如果有需要手动写的文本输出格式。

xml输出类似这样

?
?

转换为json

xml2json.py model.xml > model.json

more model.json

采用json pretty print来查看json文件

jpp.py model.json | more

?
?

Xml2tojson.py 利用xmltodict 进行向json的转换

?
?

import sys,os

import xmltodict, json

doc = xmltodict.parse(open(sys.argv[1]), process_namespaces=True)

print json.dumps(doc)

?
?

Jpp.py

import sys,os

import json

s = open(sys.argv[1]).readline().decode(‘gbk‘)

print json.dumps(json.loads(s),sort_keys=True, indent=4, ensure_ascii=False).encode(‘gbk‘)

?
?

  1. 如何更方便的查看输出的模型?

    小的模型输出直接看xml文本就好,如果数据比较多处理xml不是很方便,json好一些 用python,

    但是如果转换为json的map也不是很方便因为你要按照key去访问string类型是没有自动提示的

    ?
    ?

    In [6]: import json

    ?
    ?

    In [7]: m = json.loads(open(‘./model.json‘).readline())

    ?
    ?

    In [8]: m.keys()

    Out[8]: [u‘boost_serialization‘]

    ?
    ?

    In [9]: m[‘boost_serialization‘].keys()

    Out[9]: [u‘@version‘, u‘@signature‘, u‘data‘]

    ?
    ?

    In [18]: m[‘boost_serialization‘][‘data‘][‘_trees‘][‘item‘][0].keys()

    Out[18]:

    [u‘_gainPValue‘,

    u‘@tracking_level‘,

    u‘@class_id‘,

    u‘_lteChild‘,

    u‘_gtChild‘,

    u‘_maxOutput‘,

    u‘_leafValue‘,

    u‘NumLeaves‘,

    u‘_splitGain‘,

    u‘_splitFeature‘,

    u‘_previousLeafValue‘,

    u‘_threshold‘,

    u‘@version‘,

    u‘_weight‘]

    ?
    ?

    In [19]: m[‘boost_serialization‘][‘data‘][‘_trees‘][‘item‘][0][‘_splitGain‘][‘item‘][10]

    Out[19]: u‘3.89894126598927926e+00‘

    ?
    ?

    由于python提示的时候_开头的作为private默认是不提示的,因此做了修改

    #include "conf_util.h"

    #include <boost/serialization/nvp.hpp>

    #define GEZI_SERIALIZATION_NVP(name)

    boost::serialization::make_nvp(gezi::conf_trim(#name).c_str(), name)

    ?
    ?

    这样展示的就是gainPvalue这样没有_开头了

    ?
    ?

    利用python的自省功能可以把json解析得到的dict数据,string作为key的转为一个python object方便访问如下

    def h2o(x):

    if isinstance(x, dict):

    return type(‘jo‘, (), {k: h2o(v) for k, v in x.iteritems()})

    elif isinstance(x, list):

    l = [h2o(item) for item in x]

    return l

    else:

    return x

    ?
    ?

    def h2o2(x):

    if isinstance(x, dict):

    return type(‘jo‘, (), {k: h2o2(v) for k, v in x.iteritems()})

    elif isinstance(x, list):

    return type(‘jo‘, (), {"i" + str(idx): h2o2(val) for idx, val in enumerate(x)})

    return l

    else:

    return x

    ?
    ?

    def xmlfile2obj(path):

    import xmltodict

    doc = xmltodict.parse(open(path), process_namespaces=True)

    return h2o(doc)

    ?
    ?

    def xmlfile2obj2(path):

    import xmltodict

    doc = xmltodict.parse(open(path), process_namespaces=True)

    return h2o2(doc)

    ?
    ?

    这样对于序列化之后的xml文件可以直接使用 m = xmlfile2obj(‘*.xml‘) 或者 m = xml2obj2(‘*.xml‘)

    建议是用第一种,是标准转换,提供第二个接口主要是python的自动提示对于list的item就没有了,只能dir()查看。。

    第二种将[3]这样转为了.i3也就是去掉了所有list都用dict表示。

    ?
    ?

    m = xmlfile2obj(‘./model.xml‘)

    In [14]: m.boost_serialization.data.trees.item[0].splitGain.item[13]

    Out[14]: u‘3.26213753939964946e+00‘

    ?
    ?

    m = xmlfile2obj2(‘./model.xml‘)

    In [16]: m.boost_serialization.data.trees.item.i0.splitGain.item.i13

    Out[16]: u‘3.26213753939964946e+00‘

    ?
    ?

    ?
    ?

    ?
    ?

    ?
    ?

    ?
    ?

?
?

时间: 2024-07-30 23:55:11

c++序列化方法的相关文章

JSON数据的序列化方法

ajax传参是json数据对象时,最好是将json对象先序列化 var stuAnswerTotal = examModule.touch.getData('examAnswer'); console.log(stuAnswerTotal);//Object对象如下 { 17072={ "id" : 1702, "type":"1",                "val":["",'"&quo

jquery字符串序列化方法总结

在jquery中字符串序列化方法包括有param() .serialize() .serializeArray(),在这里对其常用做法进行总结. $.param()方法这是serialize()方法的核心,用来对一个数组或对象按照key/value进行序列化. 常用方法: 1 直接传递一个obj,直接转化成key=value然后用&连接起来了 2 $.param({name:'bill',age:18}); 3 结果:name=bill&age=18 4 这里的{X:Y,A:B}会变成X=

C# 的三种序列化方法

序列化是将一个对象转换成字节流以达到将其长期保存在内存.数据库或文件中的处理过程.它的主要目的是保存对象的状态以便以后需要的时候使用.与其相反的过程叫做反序列化. 序列化一个对象 为了序列化一个对象,我们需要一个被序列化的对象,一个容纳被序列化了的对象的(字节)流和一个格式化器.进行序列化之前我们先看看System.Runtime.Serialization名字空间.ISerializable接口允许我们使任何类成为可序列化的类. 如果我们给自己写的类标识[Serializable]特性,我们就

iOS 自动实现对象序列化方法

iOS 中对象序列化,需要遵行NSCoding协议,然后对对象的每个属性进行归档和接档赋值,响应的操作比较繁琐.本文主要介绍 利用 runtime遍历属性 大大简化代码量 具体实现代码如下:1.先建立NSobject的分类, 定义可能用到的相关类型 static NSString *intType = @"i"; // int_32t(枚举int型) static NSString *longTpye = @"l"; //long类型 static NSString

测试用的序列化方法

对于实体,进行底层方法测试的时候,经常逐一赋值很麻烦,网上找到序列化xml方法,感觉挺好用的. 前端调用方法时,将实体序列化写入xml文件 //xml路径 string filePath = @"D:\1.xml"; using (System.IO.StreamWriter writer = new System.IO.StreamWriter(filePath)) { //fileinfo为实体名称 System.Xml.Serialization.XmlSerializer xs

使用反射自定义序列化方法

在使用JSONObject和JSONArray的过程中,往往让人惊叹它的神奇之处,能够很方面的把json对象和bean互相转换,一直在思考究竟后台如何实现的,虽然通过看源码可以得出答案,但毕竟源码过于繁复,短时间内难以尽解,不如自己思考:如果这个功能是我设计的,我会怎么实现呢?其实无非就是使用反射而已,加上循环和迭代,把集合类型和嵌套的对象都迭代出来. 被序列化的类详见:http://blog.csdn.net/salerzhang/article/details/41259471 初始化一个对

django drf 10大请求序列化方法

## 整体单改 路由层.模型层.序列化层不需要做修改,只需要处理视图层:views.py ```python"""1) 单整体改,说明前台要提供修改的数据,那么数据就需要校验,校验的数据应该在实例化“序列化类对象”时,赋值给data2)修改,就必须明确被修改的模型类对象,并在实例化“序列化类对象”时,赋值给instance3)整体修改,所有校验规则有required=True的字段,都必须提供,因为在实例化“序列化类对象”时,参数partial默认为False 注:如果par

分享一个 jquery serializeArray()序列化方法

http://www.365mini.com/page/jquery-serializearray.htm http://www.365mini.com/diy.php?f=jquery-serializearray-demo <form name="myForm" action="http://www.365mini.com" method="post"> <input name="uid" type=&q

Redis 数据序列化方法 serialize, msgpack, json, hprose 比较

最近弄 Redis ,涉及数据序列化存储的问题,对比了:JSON, Serialize, Msgpack, Hprose 四种方式 1. 对序列化后的字符串长度对比: 测试代码: $arr = [0, 1, 2, 'a', 'b', 'c', 'd', 'a'=>'12', '包含中文', 'abcd包含中文efg'=>'abc一二三四defg', '键名'=>['abc'=>['def'=>123, 456, 'abcd中文内容efg'], 'a之间c'=>['a'=