CentOS上PyTorch的GPU加速配置 - 问答

在CentOS上配置PyTorch的GPU加速，你需要确保你的系统满足以下条件：

一台配备了NVIDIA GPU的计算机。
已安装CUDA Toolkit。
已安装cuDNN库。
安装了支持GPU的PyTorch版本。

以下是详细步骤：

1. 安装NVIDIA驱动

首先，确保你的NVIDIA GPU驱动已经安装并且是最新的。你可以从NVIDIA官网下载适合你GPU型号的驱动程序。

# 添加EPEL仓库
sudo yum install epel-release

# 安装NVIDIA驱动
sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
sudo yum install nvidia-driver-latest-dkms

# 重启系统
sudo reboot

重启后，你可以通过以下命令检查驱动是否安装成功：

nvidia-smi

2. 安装CUDA Toolkit

访问NVIDIA CUDA Toolkit下载页面，选择适合你系统的版本并下载。对于CentOS，你可以使用以下命令安装：

# 添加CUDA仓库
distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add -
curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sudo tee /etc/yum.repos.d/nvidia-docker.repo

# 安装CUDA Toolkit
sudo yum install cuda

# 设置环境变量
echo 'export PATH=/usr/local/cuda/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

验证CUDA是否安装成功：

nvcc --version

3. 安装cuDNN库

访问NVIDIA cuDNN下载页面，下载与你的CUDA版本兼容的cuDNN库。解压并将文件复制到CUDA目录：

# 解压cuDNN文件
tar -xzvf cudnn-11.7-linux-x64-v8.6.0.26.tgz

# 复制文件到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

4. 安装支持GPU的PyTorch

你可以使用pip来安装支持GPU的PyTorch版本。访问PyTorch官网，选择适合你系统的安装命令。例如：

# 安装支持CUDA的PyTorch
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

验证PyTorch是否能够检测到GPU：

import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(0))

如果输出显示GPU可用，并且显示了GPU的名称，那么恭喜你，PyTorch的GPU加速已经配置成功！

请注意，上述步骤可能会随着软件版本的更新而发生变化。建议在安装前查看最新的官方文档以获取最准确的指导。

0 赞

0 踩