0.环境

ubuntu16.04
pytorch1.1.0

1.问题

RuntimeError: [enforce fail at /pytorch/third_party/gloo/gloo/transport/tcp/device.cc:127] rp != nullptr. Unable to find address for: my_username

说找不到my_username地址。

2.解决问题

(1)通过查询资料:

即使有上面的,对docker不是很了解也很难解决。不要一言不合就删除docker container,问问熟悉这些的人,有时候一两句话还是挺重要的不一定能帮你解决问题,但是有启发啊。

(2)退出docker,在外面通过ifconfig查询,发现docker使用的是docker0,其他的机器是docker里面是不知道的。

最后通过声明地址解决:

export GLOO_SOCKET_IFNAME=docker0

参考

1.Runtime error using Distributed with gloo

Logo

有“AI”的1024 = 2048,欢迎大家加入2048 AI社区

更多推荐