如何检查NCCL的版本

2024-09-07 09:59:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在远程访问高性能计算节点。我不确定NVIDIA Collective Communications Library(NCCL)是否安装在我的目录中?有没有办法检查NCCL


Tags: 目录节点远程library高性能collectivenvidia办法
2条回答

通常可以在命令行中执行此操作:

nvcc  version

您可能必须运行:

sudo apt install nvidia-cuda-toolkit

也是


正如另一位回答者所提到的,您可以:

torch.cuda.nccl.version()

在皮托克。将此复制粘贴到您的终端:

python -c "import torch;print(torch.cuda.nccl.version())"

我相信tensorflow中也有类似的东西

如果使用PyTorch,可以尝试locate nccl| grep "libnccl.so" | tail -n1 | sed -r 's/^.*\.so\.//'torch.cuda.nccl.version()

检查此链接Command Cheatsheet: Checking Versions of Installed Software / Libraries / Tools for Deep Learning on Ubuntu

对于有时没有locate可用的容器,可以将其替换为ldconfig -vldconfig -v | grep "libnccl.so" | tail -n1 | sed -r 's/^.*\.so\.//'

相关问题 更多 >