11、YOLO训练后输出时参数不同的原因分析：

其中一个原因是因为使用了Fuse前向加速推理方法，将Conv和BN层融合在了一起，具体见torch_utils.py文件中的fuse_conv_and_bn函数。验证时，由于加载的是训练好的权重文件，参数不需要更新，所以不需要求梯度，因此gradients=0。训练时所有参数都需要梯形反向传播，所以训练时grandients = parameters。原因也是使用了Fuse前向加速推理方法，将Co

qq_39522016

1985人浏览 · 2023-12-24 15:36:45

qq_39522016 · 2023-12-24 15:36:45 发布

网络输出显示：
在这里插入图片描述
训练输出显示：

上述Model Summary显示计算不同的原因共有三点：

Layers：可以看到验证时网络层数减少了很多

其中一个原因是因为使用了Fuse前向加速推理方法，将Conv和BN层融合在了一起，具体见torch_utils.py文件中的fuse_conv_and_bn函数

Parameters：显示参数量减少

原因也是使用了Fuse前向加速推理方法，将Conv和BN层融合在一起，相当于砍掉了BN层

grandients:训练后表示gradients=0

训练时所有参数都需要梯形反向传播，所以训练时grandients = parameters
验证时，由于加载的是训练好的权重文件，参数不需要更新，所以不需要求梯度，因此gradients=0

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

[ 开源 ] FastAPI + LangGraph 实战智能客服 Agent：从工单分类到自动回复与业务回写附github

2048 AI社区

一文分清Agent与Skill

2048 AI社区

大厂Java面试实战：Spring Boot/Cloud、Redis/Kafka、JVM调优与Spring AI RAG（内容社区UGC+AIGC客服场景）

以“内容社区+UGC+AIGC智能客服”为业务背景，模拟大厂Java面试：严肃面试官循序渐进提问Spring Boot/Cloud、JVM、Redis、Kafka、数据库、观测、CI/CD与Spring AI/RAG/Agent等，小Y简单题会答复杂题含糊。文末给出每题详细答案与落地方案，便于小白系统学习。