使用nvidia smi检查nvidia gpu状态的nagios插件

nagios-nvidia-smi-plugin的Python项目详细描述


此插件通过提供的nvidia smi可执行文件检查nvidia gpu状态 通过英伟达电流。

设置

  1. pip安装nagios nvidia smi插件

  2. /usr/local/bin/check_nvidiasmi.py-h:

    usage: check_nvidiasmi.py [-h] [-w RANGE] [-c RANGE] [-W RANGE] [-C RANGE]
                              [-t RANGE] [-T RANGE] [-d DEVICE] [-v]
    
    Nagios plugin to check Nvidia GPU status using nvidia-smi
    
    optional arguments:
      -h, --help            show this help message and exit
      -w RANGE, --gpu_warning RANGE
                            warning if threshold is outside RANGE
      -c RANGE, --gpu_critical RANGE
                            critical if threshold is outside RANGE
      -W RANGE, --mem_warning RANGE
                            warning if threshold is outside RANGE
      -C RANGE, --mem_critical RANGE
                            critical if threshold is outside RANGE
      -t RANGE, --gputemp_warning RANGE
                            warning if threshold is outside RANGE
      -T RANGE, --gputemp_critical RANGE
                            critical if threshold is outside RANGE
      -d DEVICE, --device DEVICE
                            Device ID (starting from 0)
      -v, --verbose         increase verbosity (use up to 3 times)
    

释放量

0.4.0-2015年5月6日:指定要检查的设备,并添加温度检查;谢谢@gslongo! 0.2.0-2013年1月16日:首次发布

开发

把我叉在Github上。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java匹配正则表达式并提取组oneliner   同步嵌套映射和集合(Java)   使用ApachePOI将结果集从Java数据库导出到Excel   java创建一个方法,其中变量是jTable   java如何创建带有嵌套循环的半菱形形状?   C/C++和Java的调试器   Java API中的生成器模式示例?   java代码分支应该应用什么样的单元测试组合?   如何求算法的时间复杂度   java如果我想代理所有服务调用,以便在不显式调用记录器的情况下正确记录它们,我有什么选择?   RabbitMQ java客户端到多个队列的连接   出现第一个空格之前的java掩码字符串   java使用子类对象修改其超类对象中的受保护属性   java如何使用PagerSlidingTabStrip删除选项卡?   java在禁用按钮后刷新整数值