[PyTorch] RuntimeError: CUDA out of memory | GPU多卡使用

在程序最开始：使用单卡（前面也只写一个GPU），将数据和模型放到GPU上：使用多卡，针对模型，进行并行化处理：

让我安静会

2861人浏览 · 2022-06-06 20:41:33

让我安静会 · 2022-06-06 20:41:33 发布

在程序最开始：

import os
os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID"
os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3'  # 使用多卡
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

使用单卡（前面也只写一个GPU），将数据和模型放到GPU上：

input = data.to(device)
model = MyModule(xxx).to(device)

使用多卡，针对模型，进行并行化处理：

model = MyModule(xxx)
if torch.cuda.device_count() > 1:
	print("Let's use", torch.cuda.device_count(), "GPUs!")
	model = nn.DataParallel(model)
model = model.to(device)

参考：

RuntimeError: CUDA out of memory 解决办法：https://blog.csdn.net/Wadewhl/article/details/123891113
【NLP】pytorch中CPU、GPU的使用（仅CPU、单机多卡、多机多卡）：https://blog.csdn.net/sunflower_sara/article/details/109675174
Pytorch的nn.DataParallel：https://zhuanlan.zhihu.com/p/102697821

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

Expect脚本实战：多条件匹配与防卡死技巧

在自动化测试和系统初始化中，我们常常使用 Expect 脚本来完成一系列交互操作，比如自动输入密码、监听输出并作出响应。然而，实际项目中可能遇到多步骤输出匹配的场景：只有在先匹配到某一行输出，再匹配到另一行输出时，才需要做出响应。同时，如果 “testX failed” 出现了，但 “set params error” 没有在合理时间内出现，不要卡死，而是打印警告并继续。这个写法的问题在于：如

2048 AI社区

AI模型版本控制的标签管理：架构师的技巧

在AI模型生命周期中，版本控制是保障模型可追溯性、协作效率与生产可靠性的核心环节。而标签管理作为版本控制的"语义接口"，其设计质量直接决定了团队对模型版本的理解、检索与复用能力。本文从架构师视角出发，结合第一性原理与MLOps实践，系统阐述AI模型标签管理的理论框架、架构设计、实现机制与高级考量。通过拆解标签的"唯一标识+语义描述"本质，提出四维标签模型。