如何在CentOS上使用GPU加速PyTorch - 问答

在CentOS上使用GPU加速PyTorch，你需要确保你的系统满足以下条件：

硬件要求：你有一块支持CUDA的NVIDIA GPU。
软件要求：CentOS操作系统，NVIDIA驱动程序，CUDA Toolkit，cuDNN库，以及PyTorch。

以下是详细步骤：

1. 安装NVIDIA驱动程序

首先，你需要安装适用于你的GPU的NVIDIA驱动程序。你可以从NVIDIA官方网站下载最新的驱动程序。

# 添加EPEL仓库
sudo yum install epel-release

# 安装NVIDIA驱动程序
sudo yum install nvidia-driver-latest-dkms

重启系统以应用驱动程序：

sudo reboot

验证驱动程序是否安装成功：

nvidia-smi

2. 安装CUDA Toolkit

从NVIDIA官方网站下载适用于你的GPU和操作系统的CUDA Toolkit。以下是一个示例命令，用于安装CUDA 11.7：

# 下载CUDA Toolkit 11.7
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run

# 运行安装程序
sudo sh cuda_11.7.0_515.43.04_linux.run

# 按照提示完成安装

安装完成后，添加CUDA路径到环境变量：

echo 'export PATH=/usr/local/cuda-11.7/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

验证CUDA是否安装成功：

nvcc --version

3. 安装cuDNN库

从NVIDIA官方网站下载适用于你的CUDA版本的cuDNN库。以下是一个示例命令，用于安装cuDNN 8.2.2：

# 下载cuDNN 8.2.2 for CUDA 11.7
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.2/11.7_20210301/cudnn-11.7-linux-x64-v8.2.2.26.tgz

# 解压文件
tar -xzvf cudnn-11.7-linux-x64-v8.2.2.26.tgz

# 复制文件到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

4. 安装PyTorch

你可以使用pip安装支持CUDA的PyTorch版本。以下是一个示例命令，用于安装PyTorch 1.10.0：

# 安装PyTorch 1.10.0 with CUDA 11.7
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117

验证PyTorch是否支持GPU：

import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))

如果输出显示GPU可用并且设备名称正确，那么你已经成功在CentOS上使用GPU加速PyTorch。

总结

安装NVIDIA驱动程序。
安装CUDA Toolkit。
安装cuDNN库。
使用pip安装支持CUDA的PyTorch版本。

通过这些步骤，你应该能够在CentOS上成功配置和使用GPU加速PyTorch。

0 赞

0 踩