centos

PyTorch在CentOS上的GPU加速支持

小樊
35
2025-12-05 23:06:26
栏目: 智能运维

在 CentOS 上启用 PyTorch 的 GPU 加速

支持概览与前置条件

标准安装步骤

  1. 检查 GPU 与驱动
    • 执行 nvidia-smi 查看驱动与 GPU 状态;若未安装,先从 NVIDIA 官网获取与显卡型号匹配的驱动。
  2. 安装 CUDA Toolkit
    • 选择与目标 PyTorch 版本匹配的 CUDA 版本,下载安装包(如 .run 文件),执行安装并按提示完成。
    • 配置环境变量(示例):
      • export PATH=/usr/local/cuda/bin:$PATH
      • export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
      • 使配置生效:source ~/.bashrc
  3. 安装 cuDNN(与 CUDA 版本严格匹配)
    • 下载对应 cuDNN,解压后将头文件与库复制到 CUDA 目录,并设置权限:
      • sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
      • sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
      • sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
  4. 安装 PyTorch(pip 或 conda)
    • 选择与已安装 CUDA 版本一致的 PyTorch 预编译包。
  5. 验证安装
    • 运行 Python 验证:
      • import torch
      • print(torch.cuda.is_available())
      • print(torch.cuda.current_device())
      • print(torch.cuda.get_device_name(torch.cuda.current_device()))
    • 返回 True 与正确的 GPU 型号 即表示配置成功。

版本匹配与安装命令示例

组件 版本示例 安装要点
CUDA 11.7 安装后设置 PATHLD_LIBRARY_PATH
cuDNN 8.4.1.50 与 CUDA 11.7 匹配,复制至 CUDA 目录
PyTorch(pip) cu117 pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
PyTorch(conda) cudatoolkit=11.7 conda install pytorch torchvision torchaudio cudatoolkit=11.7 -c pytorch

容器化与多 GPU 场景

常见问题与排查

0
看了该问题的人还看了