centos

如何在CentOS上使用GPU加速PyTorch

小樊
93
2025-02-14 17:34:54
栏目: 智能运维

在CentOS上使用GPU加速PyTorch,你需要确保你的系统满足以下条件:

  1. 硬件要求:你有一块支持CUDA的NVIDIA GPU。
  2. 软件要求:CentOS操作系统,NVIDIA驱动程序,CUDA Toolkit,cuDNN库,以及PyTorch。

以下是详细步骤:

1. 安装NVIDIA驱动程序

首先,你需要安装适用于你的GPU的NVIDIA驱动程序。你可以从NVIDIA官方网站下载最新的驱动程序。

# 添加EPEL仓库
sudo yum install epel-release

# 安装NVIDIA驱动程序
sudo yum install nvidia-driver-latest-dkms

重启系统以应用驱动程序:

sudo reboot

验证驱动程序是否安装成功:

nvidia-smi

2. 安装CUDA Toolkit

从NVIDIA官方网站下载适用于你的GPU和操作系统的CUDA Toolkit。以下是一个示例命令,用于安装CUDA 11.7:

# 下载CUDA Toolkit 11.7
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run

# 运行安装程序
sudo sh cuda_11.7.0_515.43.04_linux.run

# 按照提示完成安装

安装完成后,添加CUDA路径到环境变量:

echo 'export PATH=/usr/local/cuda-11.7/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

验证CUDA是否安装成功:

nvcc --version

3. 安装cuDNN库

从NVIDIA官方网站下载适用于你的CUDA版本的cuDNN库。以下是一个示例命令,用于安装cuDNN 8.2.2:

# 下载cuDNN 8.2.2 for CUDA 11.7
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.2/11.7_20210301/cudnn-11.7-linux-x64-v8.2.2.26.tgz

# 解压文件
tar -xzvf cudnn-11.7-linux-x64-v8.2.2.26.tgz

# 复制文件到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

4. 安装PyTorch

你可以使用pip安装支持CUDA的PyTorch版本。以下是一个示例命令,用于安装PyTorch 1.10.0:

# 安装PyTorch 1.10.0 with CUDA 11.7
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117

验证PyTorch是否支持GPU:

import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))

如果输出显示GPU可用并且设备名称正确,那么你已经成功在CentOS上使用GPU加速PyTorch。

总结

  1. 安装NVIDIA驱动程序。
  2. 安装CUDA Toolkit。
  3. 安装cuDNN库。
  4. 使用pip安装支持CUDA的PyTorch版本。

通过这些步骤,你应该能够在CentOS上成功配置和使用GPU加速PyTorch。

0
看了该问题的人还看了