TorchScript VS. ONXX

使用ONNX和Torchscript加快推理速度的测试 - 知乎 (zhihu.com)结论：1. Batch size小时，ONNX明显比TorchScript要快；Batch size大时，差距缩小；2. Batch内部的序列长度相似时，Batch size越大，加速效果约好；3. 序列越长，加速效果越不明显4. Batch内部的序列长度相差大的话，Batch size可能在中间某个范围是加速

smartcat2010

1740人浏览 · 2021-11-28 14:54:01

smartcat2010 · 2021-11-28 14:54:01 发布

https://onnxruntime.ai/docs/tutorials/accelerate-pytorch/pytorch.html

1. 什么时候直接用PyTorch来推理：

现成的PyTorch库和Python环境都在，且不care推理速度；

2. 什么时候用TorchScript来推理：

移动端等轻量级环境，不能安装PyTorch、Python这样的大size库时；

（PyTorch官方也说其对计算图进行了优化，可以比PyTorch直接推理要更快）（个人感觉，其实就是Facebook不想完全依赖ONNX，自己想独立做自己的部署方案）

3. 什么时候用ONNX Runtime来推理：

在意推理速度；需要部署到不同的设备上；（也支持TensorFlow等多种框架的模型）

使用ONNX和Torchscript加快推理速度的测试 - 知乎 (zhihu.com)

结论：

1. Batch size小时，ONNX明显比TorchScript要快；Batch size大时，差距缩小；

2. Batch内部的序列长度相似时，Batch size越大，加速效果约好；

3. 序列越长，加速效果越不明显

4. Batch内部的序列长度相差大的话，Batch size可能在中间某个范围是加速比最大的，因为再大就带来很多“补齐”造成的冤枉计算。

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

【运维】阿里云ARMS全解析：从技术原理到企业级落地实践

摘要：阿里云ARMS（应用实时监控服务）是一站式全链路可观测平台，通过无侵入采集、实时分析与智能告警，帮助开发者解决分布式系统监控难题。其核心架构包含数据采集层（基于Java Agent字节码增强）、传输存储层（流式计算引擎）、分析可视化层（服务拓扑与链路追踪）及告警联动层。ARMS支持快速接入Java应用，提供业务自定义监控能力，并集成RASP安全防护。企业案例显示，ARMS能显著缩短故障恢复时