当我们使用nvidia-smi 查看 GPU 状态时,显示GPU使用率100%

在这里插入图片描述

那么该如何解决呢?

分析后,可能的原因是加载 NVIDIA 驱动时,ECC Memory Scrubbing 机制造成的。

解决办法:

执行 nvidia-smi -pm 1 命令,让 GPU Driver 进入 Persistence 模式。

首先登陆我们的GPU云服务器,输入下面的命令:

nvidia-smi -pm 1

在这里插入图片描述

然后再来查看一下GPU 使用率

nvidia-smi

在这里插入图片描述

可以看到已经显示正常了。

阿里云服务器优惠活动及详细教程:syunz.com/act/aliyun
腾讯云服务器优惠活动及详细教程:syunz.com/act/qcloud

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐