2024-09-25 08:39:17 发布
网友
我们只有4个GPU设备。我们有4个以上的用户要运行cuda程序,所以在我运行我的程序之前,我要检查哪个设备不忙,否则它会分配内存失败。但是我还没有找到一个函数来获取这个标签。我知道当我们想使用设备时,我们称之为“cudaSetDevice()”,所以每个设备都必须有一个标记。而“nvidiasmi”可以获得更多的细节,包括哪个进程正在使用哪个设备以及它使用了多少内存。谁能帮我?在
cudaSetDevice的值从0开始,然后对于每个附加设备单调增加。或者,可以设置环境变量CUDA_VISIBLE_DEVICES以选择要使用的设备。(见https://devblogs.nvidia.com/parallelforall/cuda-pro-tip-control-gpu-visibility-cuda_visible_devices/)。在
要获取有关使用设备的信息,您需要使用驱动程序API:http://docs.nvidia.com/cuda/cuda-driver-api/index.html
cudaSetDevice的值从0开始,然后对于每个附加设备单调增加。或者,可以设置环境变量CUDA_VISIBLE_DEVICES以选择要使用的设备。(见https://devblogs.nvidia.com/parallelforall/cuda-pro-tip-control-gpu-visibility-cuda_visible_devices/)。在
要获取有关使用设备的信息,您需要使用驱动程序API:http://docs.nvidia.com/cuda/cuda-driver-api/index.html
相关问题 更多 >
编程相关推荐