解决pytorch DDP 报错This error indicates that your module has parameters that were not used

这时未使用的参数就会未参与梯度的计算，因此可以获取未使用参数，并注释掉消除错误。使用pytorch DDP训练的时候，有的时候会报错。现在单GPU下做一个iteration，并在。

npupengsir

730人浏览 · 2023-11-11 20:21:09

npupengsir · 2023-11-11 20:21:09 发布

使用pytorch DDP训练的时候，有的时候会报错This error indicates that your module has parameters that were not used。

解决办法:

现在单GPU下做一个iteration，并在loss.backward()和optimizer.step()之间插入以下代码:

for name, param in model.named_parameters():
    if param.grad is None:
        print(name)

这时未使用的参数就会未参与梯度的计算，因此可以获取未使用参数，并注释掉消除错误。完整代码如下:

model = model().cuda()
x = torch.rand((...)).cuda()

criterion = torch.nn.MSELoss(reduction='sum')
optimizer = torch.optim.SGD(model.parameters(), lr=1e-4)

y_pred = model(x)

y = y_pred

loss = criterion(y_pred, y)

# Zero gradients, perform a backward pass, and update the weights.
optimizer.zero_grad()
loss.backward()

for name, param in model.named_parameters():
    if param.grad is None:
        print(name)

optimizer.step()

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

从「能用」到「可靠」：深入探讨C++异常安全

目标明确：首先追求基本保证（无泄漏），这是底线。然后，对于关键操作，努力实现强保证。拥抱 RAII：这是你最重要的工具。用智能指针、容器管理资源，对于自定义资源，封装成 RAII 类。善用 "Copy-and-Swap"：这是实现强保证函数的一个通用且有效的方法。正确使用noexcept：为移动操作、swap和析构函数标记noexcept。严守铁律：决不让异常从析构函数中逃逸。异常安全不是事后添加