在CentOS上使用GPU加速PyTorch,你需要确保你的系统满足以下条件:
以下是详细步骤:
首先,你需要安装适用于你的GPU的NVIDIA驱动程序。你可以从NVIDIA官方网站下载最新的驱动程序。
# 添加EPEL仓库
sudo yum install epel-release
# 安装NVIDIA驱动程序
sudo yum install nvidia-driver-latest-dkms
重启系统以应用驱动程序:
sudo reboot
验证驱动程序是否安装成功:
nvidia-smi
从NVIDIA官方网站下载适用于你的GPU和操作系统的CUDA Toolkit。以下是一个示例命令,用于安装CUDA 11.7:
# 下载CUDA Toolkit 11.7
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
# 运行安装程序
sudo sh cuda_11.7.0_515.43.04_linux.run
# 按照提示完成安装
安装完成后,添加CUDA路径到环境变量:
echo 'export PATH=/usr/local/cuda-11.7/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
验证CUDA是否安装成功:
nvcc --version
从NVIDIA官方网站下载适用于你的CUDA版本的cuDNN库。以下是一个示例命令,用于安装cuDNN 8.2.2:
# 下载cuDNN 8.2.2 for CUDA 11.7
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.2/11.7_20210301/cudnn-11.7-linux-x64-v8.2.2.26.tgz
# 解压文件
tar -xzvf cudnn-11.7-linux-x64-v8.2.2.26.tgz
# 复制文件到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
你可以使用pip安装支持CUDA的PyTorch版本。以下是一个示例命令,用于安装PyTorch 1.10.0:
# 安装PyTorch 1.10.0 with CUDA 11.7
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
验证PyTorch是否支持GPU:
import torch
print(torch.cuda.is_available())
print(torch.cuda.current_device())
print(torch.cuda.get_device_name(torch.cuda.current_device()))
如果输出显示GPU可用并且设备名称正确,那么你已经成功在CentOS上使用GPU加速PyTorch。
通过这些步骤,你应该能够在CentOS上成功配置和使用GPU加速PyTorch。