简介:本文将介绍在Docker内部执行nvidia-smi无任何显示的解决方法,包括重新安装NVIDIA Container Toolkit、更新安装源、配置Docker以便正确识别NVIDIA的容器运行时库等步骤。
在使用Docker运行深度学习或GPU加速的应用时,有时候会遇到Docker内部执行nvidia-smi无任何显示的问题。这可能是由于Docker内部的Nvidia显卡驱动异常或未正确配置导致的。下面是一些解决此问题的步骤:
# 重新安装Dockercurl https://get.docker.com | shsudo systemctl --now enable docker# 设置安装包和GPG key的仓库地址distribution=$(./etc/os-release; echo $ID$VERSION_ID)sudo curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpgsudo curl -s -L https://nvidia.github.io/libnvidia-container/$distribution/libnvidia-container.list | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list# 更新安装源sudo apt-get update# 安装nvidia-container-toolkitsudo apt-get install -y nvidia-container-toolkit# 配置Docker以便正确识别NVIDIA的容器运行时库sudo nvidia-ctk runtime configure --runtime=docker# 重启Dockersudo systemctl restart docker
sudo apt-get update
sudo apt-get install dkmssudo dkms install -m nvidia -v 460.91.03 * 其中460.91.03为当前驱动版本
以上是解决Docker内部执行nvidia-smi无任何显示问题的一些常见方法。如果问题仍然存在,建议查阅相关文档或寻求专业人士的帮助。
sudo rm /etc/modprobe.d/*/lib/modprobe.d/*blacklist-nvidia.conf * blacklist-nvidia.conf这个名字在不同系统上可能会有细微不同,但都会包含nvidia和blacklist关键字