pytorch1.0 用torch script导出保存模型

python的易上手和pytorch的动态图特性，使得pytorch在学术研究中越来越受欢迎，但在生产环境，碍于python的GIL等特性，可能达不到高并发、低延迟的要求，存在需要用c++接口的情况。除了将模型导出为ONNX外，pytorch1.0给出了新的解决方案：pytorch 训练模型 - 通过torch script中间脚本保存模型 -- C++加载模型。最近工作需要尝试做了转换，总结一下步骤和遇到的坑。

用torch script把torch模型转成c++接口可读的模型有两种方式：trace && script. trace比script简单，但只适合结构固定的网络模型，即forward中没有控制流的情况，因为trace只会保存运行时实际走的路径。如果forward函数中有控制流，需要用script方式实现。

trace顾名思义，就是沿着数据运算的路径走一遍，官方例子：

import torch
def foo(x, y):
    return 2*x + y
traced_foo = torch.jit.trace(foo, (torch.rand(3), torch.rand(3)))

script稍复杂，主要改三处：

1. Model由之前继承 nn.Model 改为继承 torch.jit.ScriptModule

2. forward函数前加 @torch.jit.script_method

3. 其他需要调用的函数前加 @torch.jit.script

踩过的坑&&解决方法：

A. torch script默认函数或方法的参数都是Tensor类型的，如果不是需要说明，不然调用非Tensor参数时会报类型不符的编译错误。

python3可以直接:

def example_func(param_1: Tensor, param_2: int, param_3: List[int]):

python2需要用type注释：

def example_func(param_1, param_2, param_3):

#type: (Tensor, int, List[int]) -> Tensor

B. model的方法中orward加@torch.jit.script_method， __init__函数不用

C. 前面说过，torch scrip支持的函数是pytorch的子集，意味着有一部分函数不支持，例如： not boolean，pass, List的切片赋值，CPU和GPU切换的value.to( ), 需要想办法绕过去。看github上讨论区说新版好像已经支持not操作了，没有验证。

结论：pytorch 1.0目前的预览版还有比较多优化的空间，至少是在torch script支持的函数集合上，不建议使用，等稳定版发布再看看吧。

原创内容，转载请注明出处。

参考资料：

https://pytorch.org/docs/master/jit.html

https://pytorch.org/tutorials/beginner/deploy_seq2seq_hybrid_frontend_tutorial.html

p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; text-align: justify; line-height: 16.0px; font: 14.0px "Times New Roman"; color: #000000 }
span.s1 { }
span.s2 { font: 14.0px "Songti SC" }

原文地址：https://www.cnblogs.com/Arborday/p/9890999.html

时间： 2025-01-21 07:21:08

pytorch1.0 用torch script导出保存模型

pytorch1.0 用torch script导出保存模型的相关文章

[Pytorch]Pytorch 保存模型与加载模型(转)

使用Blender批量导出/转换模型

华为云EI ModelArts，从0到1开发训练AI模型，通过“极快”和“极简”实现普惠AI

Tensorflow中保存模型时生成的各种文件区别和作用

caffe使用ctrl-c不能保存模型

keras 保存模型

利用PowerDesigner逆向工程导出PDM模型及生成文档

用pytorch1.0搭建简单的神经网络：进行回归分析

Keras保存模型