如何在huggingface.co的Spaces中使用GPU，解决The model is offloaded on CPU or disk - CPU & disk offloading……

这表明模型架构需要使用GPU来运行，而不是CPU，或者你尝试指定'cuda'，但是得到。

Deng_Xian_Sheng

901人浏览 · 2024-12-10 23:38:42

Deng_Xian_Sheng · 2024-12-10 23:38:42 发布

如果你尝试在huggingface.co的Spaces中推理你的模型，结果遇到错误：

The model is offloaded on CPU or disk - CPU & disk offloading is not supported for ValueHead models.

这表明模型架构需要使用GPU来运行，而不是CPU，当前没有使用CPU来运行

或者你尝试指定'cuda'，但是得到RuntimeError: No CUDA GPUs are available，这表明它没有找到GPU

如何在huggingface.co的Spaces中使用GPU

我这里的GPU指的是ZeroGPU
你首先要确保在创建Spaces的时候勾选了ZeroGPU，而不是CPU
ps：有些人说即使勾选了CPU仍然可以调用ZeroGPU，我不确定。

如果你的项目足够好，社区会赞助你ZeroGPU，否则你需要充值 9$ 的PRO会员，充值的时候需要扣押额外的 10$ 它声称一旦完成就会返还，但是美国的银行系统决定了这可能是一个缓慢的过程。

其次，你需要将代码中执行推理的地方封装在一个函数中，并且使用修饰符

import spaces

@spaces.GPU
def run_my_big():
	pass

自此，你应该可以使用GPU了。

如果你得到如下错误，这表明你的模型被加载到GPU和CPU两个设备上，它期望加载到一个设备上（加载到GPU上）

RuntimeError: Expected all tensors to be on the same device, but found at least two devices, cuda:0 and cpu! (when checking argument for argument index in method wrapper_CUDA__index_select)

你可以这样做

import torch
device = torch.device("cuda:0")  # 明确指定设备
xxx.to(device)  # 确保模型在cuda:0设备上,写法取决于你使用的框架，请查阅文档

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

人工智能如何改变 Anthropic 的工作方式5

如果有一天，你走进公司，发现写代码、查 bug、跑实验的大部分体力活，都已经由一位看不见的 AI 搭档在后台悄悄完成了——而你更多是在提问题、定方向、做决策，而不是一行行敲代码，这会是什么感觉？是兴奋，因为产出翻倍、想法终于可以快速落地；还是隐隐不安，因为自己赖以安身立命的“手艺”似乎正在慢慢被接管？对于正在建设 AI 的公司来说，这个问题来得比想象中更早、更猛。