【三种可能问题】RuntimeError: cuDNN error: CUDNN_STATUS_NOT_SUPPORTED
简述查了很久,还是没找到我对应的问题的解决方案。最后还是大佬给来一个可行的代码,我才找到的。batch size 太大了。(最大可能问题)cude和cudnn版本之间冲突。(很少见,一般都可以,我给一个可行版本,我的是cude11,cudnn8)amp(fp16) 和 tf32 的选择问题。(我遇到的就是这个,这个其实是这个报错的本来含义emmmm)解决方案选一个执行即可,第二个大概率不用(作为最
·
简述
查了很久,还是没找到我对应的问题的解决方案。最后还是大佬给来一个可行的代码,我才找到的。
batch size
太大了。(最大可能问题)- cude和cudnn版本之间冲突。(很少见,一般都可以,我给一个可行版本,我的是cude11,cudnn8)
amp(fp16)
和tf32
的选择问题。(我遇到的就是这个,这个其实是这个报错的本来含义emmmm)
解决方案
选一个执行即可,第二个大概率不用(作为最后方案)
batch size
设置的小一点- 重装cuda或者cudnn
- 将
fp16
设置为tf32
参考:
- https://developer.nvidia.com/zh-cn/blog/accelerating-tensorflow-on-a100-gpus/
更多推荐
所有评论(0)