Tensorflow、Horovod和NVLINK未找到

2024-09-28 22:24:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试运行一个tensorflow神经网络,它使用uber的horovod库在GPU上运行。同时,我尝试运行一个测量脚本来测量多个gpu之间的nvlinks。唉,每当我运行该文件时,都会出现以下错误:

tensorflow.python.framework.errors_impl.NotFoundError: /home/pat/.virtualenvs/venv/lib/python3.6/site-packages/horovod /tensorflow/mpi_lib.cpython-36m-x86_64-linux-gnu.so: undefined symbol: _ZN10tensorflow14kernel_factory17OpKernelRegist rar12InitInternalEPKNS_9KernelDefEN4absl11string_viewESt10unique_ptrINS0_15OpKernelFactoryESt14default_deleteIS8_EE

有人知道如何解决这个问题吗?你知道吗

谢谢你。你知道吗


Tags: 文件脚本gpulibtensorflow错误framework神经网络