监视nvidia gpu状态和使用情况的实用程序
gpustat的Python项目详细描述
gpustat
只是比英伟达SMI少点?
注意:这只适用于nvidia图形设备,目前没有amd支持。欢迎投稿!
自我提升:一个gpustat
的web界面是可用的(在alpha中)!签出gpustat-web。
用法
$ gpustat
选项:
--color
:强制彩色输出(即使stdout不是tty)--no-color
:抑制彩色输出-u
,--show-user
:显示进程所有者的用户名-c
,--show-cmd
:显示进程名-p
,--show-pid
:显示进程的PID-F
,--show-fan
:显示GPU风扇速度-P
,--show-power
:显示GPU功耗和/或限制(draw
或draw,limit
)--watch
,-i
,--interval
:如果给定,则在监视模式下运行(相当于watch gpustat
)。表示更新之间的间隔。(#41)--json
:json输出(实验,#10)
提示
- 要定期观看,请尝试
gpustat --watch
或gpustat -i
(#41)。- 对于旧版本,可以使用
watch --color -n1.0 gpustat --color
。
- 对于旧版本,可以使用
- 运行
nvidia-smi daemon
(需要根特权)将使查询更快并使用更少的cpu(#54)。 - 由
gpustat
(和nvidia-smi
)显示的gpu id(索引)是pci总线id, 而cuda在默认情况下以最低的id分配最快的gpu。 因此,为了使cuda和gpustat
使用相同的gpu索引, 将CUDA_DEVICE_ORDER
环境变量配置为PCI_BUS_ID
(在为CUDA程序设置CUDA_VISIBLE_DEVICES
之前):export CUDA_DEVICE_ORDER=PCI_BUS_ID
。
快速安装
从PyPI:
安装pip install gpustat
要通过PIP安装最新版本(主分支):
pip install git+https://github.com/wookayin/gpustat.git@master
如果您没有根权限,请尝试在用户命名空间上安装:pip install --user
。
注意,从v0.4开始,gpustat.py
不再是零依赖的可执行文件。
但是,在极少数情况下,您需要一个可执行脚本(传统脚本),也可以尝试:
wget https://raw.githubusercontent.com/wookayin/gpustat/v0.3.2/gpustat.py -O ~/.local/bin/gpustat
chmod +x ~/.local/bin/gpustat # Assuming ~/.local/bin is in your $PATH