Ubuntu 22.04上RTX 4090显卡与PyTorch深度学习环境的配置全攻略

作者:Nicky2023.12.25 15:37浏览量:500

简介:ubuntu22.04更换RTX 4090显卡后,安装驱动和pytorch记录

ubuntu22.04更换RTX 4090显卡后,安装驱动和pytorch记录
一、背景
随着深度学习的发展,显卡成为了处理复杂计算任务的重要硬件。近期,NVIDIA发布了新一代的RTX 4090显卡,其强大的性能吸引了许多深度学习从业者。为了进一步提高工作站的性能,我们决定将Ubuntu 22.04服务器上的显卡更换为RTX 4090。本文将详细记录更换过程,包括安装驱动和配置PyTorch环境。
二、准备阶段
在开始之前,我们需要先从NVIDIA官网下载最新的驱动程序,并确保我们的系统已更新到最新状态。我们还需要准备好所需的工具,如螺丝刀、显卡插槽固定螺丝等。
三、更换显卡
更换显卡的过程相对简单,只需要按照以下步骤进行:

  1. 关闭计算机,拔掉电源线,确保安全
  2. 打开机箱,找到原来的显卡,并拔掉连接线。
  3. 用螺丝刀拆下原来显卡的固定螺丝。
  4. 拿起新的RTX 4090显卡,确保金手指与主板插槽完全吻合。然后插上连接线,旋紧固定螺丝。
  5. 连接电源线,然后开机测试新显卡是否正常工作。
    四、安装驱动程序
    在确认新显卡正常工作后,我们就可以开始安装驱动程序了。
  6. 访问NVIDIA官网,下载适用于Ubuntu 22.04的最新驱动程序。
  7. 打开终端,进入下载的驱动程序目录,执行以下命令进行安装:
    1. sudo sh NVIDIA-Linux-x86_64-470.127.01.run
  8. 按照提示完成驱动程序的安装过程。在安装过程中,系统可能会询问你是否同意许可协议,以及是否要安装最新的NVIDIA组件。选择同意并继续安装即可。
  9. 安装完成后,重新启动计算机以确保驱动程序正常工作。
    五、配置PyTorch环境
    为了使用新显卡进行深度学习训练,我们还需要配置PyTorch环境。以下是详细的步骤:
  10. 首先确保已经安装了Python和pip。可以通过以下命令检查:
    1. python --version
    2. pip --version
  11. 使用以下命令安装PyTorch:
    1. pip install torch torchvision torchaudio -f https://download.pytorch.org/whl/cu113/torch_stable.html
    注意:上述命令中的cu113需要根据你的CUDA版本进行修改。如果你的CUDA版本是11.1,那么应该使用cu111。CUDA版本可以在终端输入nvcc —version查看。
  12. 验证PyTorch是否正确安装:
    1. python -c "import torch; print(torch.__version__)"
    如果成功导入并打印出PyTorch的版本号,那么就说明安装成功。
  13. 为了能够在新显卡上运行PyTorch程序,我们需要设置CUDA_VISIBLE_DEVICES环境变量,它指定了CUDA可以访问哪些GPU。例如:
    1. export CUDA_VISIBLE_DEVICES=0
    这将使CUDA只访问第一个GPU(索引为0)。如果你的系统中只有一个GPU,那么可以省略此步骤。如果你的系统中有多于一个的GPU,那么你可以通过运行nvidia-smi命令查看所有可用的GPU。