Nvidia Tesla A100 驱动安装方法

遇到的问题:以前安装tesla系列、geforce系列等gpu 驱动的时候,只需执行nvidiaxxxx.run驱动包或者安装nvidiaxxxx.rpm包即可,但遇到新的GPU Nvidia Tesla A100的时候,安装完驱动似乎不起作用,找了半天资料,原来需要以下步骤才可以使用;

参考资料:
https://docs.nvidia.com/datacenter/tesla/pdf/fabric-manager-user-guide.pdf
https://docs.nvidia.com/datacenter/tesla/fabric-manager-user-guide/index.html#abstract

1、首先到Nvidia官网下载对应gpu 驱动文件

驱动下载连接:https://www.nvidia.cn/Download/index.aspx?lang=cn

nvidia-driver-local-repo-rhel7-470.57.02-1.0-1.x86_64.rpm
在这里插入图片描述

2、安装驱动

rpm -ivh nvidia-driver-local-repo-rhel7-470.57.02-1.0-1.x86_64.rpm
yum clean all
yum install -y cuda-drivers

3、安装fabricmanager

yum install -y cuda-drivers-fabricmanager libnvidia-nscq

4、启动服务

systemctl enable nvidia-fabricmanager
systemctl start nvidia-fabricmanager

5、测试nvidia-smi

nvidia-sminvswitch、nvlink功能可以正常使用;
在这里插入图片描述

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐