nvidia-smi简介及常用指令

作者:Nicky2024.02.16 06:20浏览量:13

简介:nvidia-smi是一个用于监控和调整NVIDIA GPU状态的命令行工具,提供了跨平台支持。通过使用这个工具,用户可以实时了解GPU的状态,如温度、功耗、显存使用情况等,并可进行一些简单的操作,如设定GPU的最大功耗或开启/关闭持久模式等。

nvidia-smi,全称为NVIDIA System Management Interface,是一个用于监控和调整NVIDIA GPU状态的命令行工具。它提供了跨平台支持,可以在所有标准的NVIDIA驱动程序支持的Linux和Windows Server 2008 R2开始的64位系统上使用。

nvidia-smi工具是N卡驱动附带的,只要装好驱动,就会有这个命令。它可以用来实时检测GPU的状态,包括GPU的温度、功耗、显存使用情况等。此外,它还可以进行一些简单的操作,如设定GPU的最大功耗或开启/关闭持久模式等。

常用指令:

  1. 查看GPU的状态:nvidia-smi
    这个命令会显示所有GPU的状态信息,包括GPU的编号、型号、温度、功耗、显存使用情况等。
  2. 实时检测GPU状态:watch -n 0.5 nvidia-smi
    这个命令会每0.5秒更新一次GPU的状态信息,可以用来实时监控GPU的状态变化。
  3. 获取GPU ID信息:nvidia-smi -L
    这个命令会显示所有GPU的详细信息,包括GPU的卡号、型号、物理UUID号等。
  4. 过滤出GPU卡号信息:nvidia-smi -L | cut -d ‘ ‘ -
    这个命令会过滤出所有GPU的卡号信息,方便用户进行后续处理。
  5. 设定GPU的最大功耗:nvidia-smi —power-set=100
    这个命令会将指定GPU的最大功耗设定为100瓦。需要注意的是,这个命令需要管理员权限才能执行。
  6. 开启持久模式:nvidia-smi -pl=100
    这个命令会将指定GPU的持久模式开启,将最大性能设置为100%。需要注意的是,这个命令需要管理员权限才能执行。
  7. 关闭持久模式:nvidia-smi -pl=0
    这个命令会将指定GPU的持久模式关闭,将最大性能设置为当前性能。
  8. 将监控结果写入文件:nvidia-smi -l 1 —format=csv —filename=report.csv —query-gpu=timestamp,name,index,utilization.gpu,memory.total,memory.used,power.draw
    这个命令会将指定字段的监控结果写入文件,方便用户进行后续分析。