我正在尝试运行一个tensorflow神经网络,它使用uber的horovod库在GPU上运行。同时,我尝试运行一个测量脚本来测量多个gpu之间的nvlinks。唉,每当我运行该文件时,都会出现以下错误:
tensorflow.python.framework.errors_impl.NotFoundError: /home/pat/.virtualenvs/venv/lib/python3.6/site-packages/horovod /tensorflow/mpi_lib.cpython-36m-x86_64-linux-gnu.so: undefined symbol: _ZN10tensorflow14kernel_factory17OpKernelRegist rar12InitInternalEPKNS_9KernelDefEN4absl11string_viewESt10unique_ptrINS0_15OpKernelFactoryESt14default_deleteIS8_EE
有人知道如何解决这个问题吗?你知道吗
谢谢你。你知道吗
请看一下回购中提出的这个问题:
https://github.com/horovod/horovod/issues/656
相关问题 更多 >
编程相关推荐