2024-10-02 08:14:41 发布
网友
我正在使用一个远程机器,它有2个GPU,以便执行一个包含CUDA代码的Python脚本。为了找到可以提高代码性能的地方,我尝试使用nvprof。在
nvprof
我在代码中设置了只想在远程机器上使用2个GPU中的一个,尽管在调用nvprof --profile-child-processes ./myscript.py时,每个GPU上都会启动一个具有相同ID的进程
nvprof --profile-child-processes ./myscript.py
我能给nvprof任何参数,以便只使用一个GPU进行分析吗?在
CUDA environment variableCUDA_VISIBLE_DEVICES可用于限制CUDA运行时API仅使用某些GPU。你可以这样做:
CUDA_VISIBLE_DEVICES
CUDA_VISIBLE_DEVICES="0" nvprof profile-child-processes ./myscript.py
另外,nvprof是documented,并且还通过nvprof help提供命令行帮助。查看命令行帮助,我看到一个 devices开关,它似乎至少限制了一些函数,使其仅使用特定的gpu。你可以试试:
nvprof help
devices
CUDA environment variable
CUDA_VISIBLE_DEVICES
可用于限制CUDA运行时API仅使用某些GPU。你可以这样做:另外,
^{pr2}$nvprof
是documented,并且还通过nvprof help
提供命令行帮助。查看命令行帮助,我看到一个devices
开关,它似乎至少限制了一些函数,使其仅使用特定的gpu。你可以试试:相关问题 更多 >
编程相关推荐