如何知道哪个设备正在运行

2024-09-25 08:39:17 发布

您现在位置:Python中文网/ 问答频道 /正文

我们只有4个GPU设备。我们有4个以上的用户要运行cuda程序,所以在我运行我的程序之前,我要检查哪个设备不忙,否则它会分配内存失败。但是我还没有找到一个函数来获取这个标签。我知道当我们想使用设备时,我们称之为“cudaSetDevice()”,所以每个设备都必须有一个标记。而“nvidiasmi”可以获得更多的细节,包括哪个进程正在使用哪个设备以及它使用了多少内存。谁能帮我?在


Tags: 函数内存用户标记程序gpu进程标签
1条回答
网友
1楼 · 发布于 2024-09-25 08:39:17

cudaSetDevice的值从0开始,然后对于每个附加设备单调增加。或者,可以设置环境变量CUDA_VISIBLE_DEVICES以选择要使用的设备。(见https://devblogs.nvidia.com/parallelforall/cuda-pro-tip-control-gpu-visibility-cuda_visible_devices/)。在

要获取有关使用设备的信息,您需要使用驱动程序API:http://docs.nvidia.com/cuda/cuda-driver-api/index.html

相关问题 更多 >