在Linux系统上安装PyTorch与CUDA的步骤如下:
首先,确保你的Linux系统满足PyTorch的系统要求。PyTorch支持的CUDA最低版本为18.04,因此建议使用Ubuntu 18.04或更高版本。
在终端中运行以下命令检查NVIDIA显卡驱动是否已安装:
nvidia-smi
如果显示CUDA版本信息,说明驱动已安装。如果没有安装,请访问NVIDIA官网下载并安装与你的显卡型号相匹配的驱动程序。
访问NVIDIA CUDA Toolkit Archive,选择与你的显卡驱动版本相适应的CUDA版本。以下是一个示例,假设我们需要安装CUDA 11.7:
wget https://developer.download.nvidia.com/compute/cuda/11.7.1/local_installers/cuda_11.7.1_515.65.01_linux.run
chmod +x cuda_11.7.1_515.65.01_linux.run
./cuda_11.7.1_515.65.01_linux.run
在安装过程中,按提示操作,注意选择自定义安装路径,并取消选择“Install CUDA driver”选项,以避免覆盖显卡驱动。
~/.bashrc文件,添加以下行:export PATH=/usr/local/cuda-11.7/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH
保存并关闭文件,然后运行以下命令使环境变量生效:
source ~/.bashrc
nvcc -V
访问NVIDIA cuDNN官方网站,下载与你的CUDA版本兼容的cuDNN库。以下是一个示例,假设我们需要安装cuDNN 8.5(对应CUDA 11.7):
wget https://developer.download.nvidia.com/compute/machine-learning/repos/ubuntu1804/x86_64/libcudnn8_8.5.0.50-1+cudnn8.5.0-1+cuda11.7_amd64.deb
sudo dpkg -i libcudnn8_8.5.0.50-1+cudnn8.5.0-1+cuda11.7_amd64.deb
~/.bashrc文件中:echo 'export PATH=/usr/lib/x86_64-linux-gnu:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc
在安装PyTorch之前,建议创建一个conda虚拟环境以隔离项目依赖:
conda create -n pytorch_env python=3.9
conda activate pytorch_env
根据你的CUDA版本,从PyTorch官网获取相应的安装命令。以下是一个示例,假设我们需要安装PyTorch 2.0.1(对应CUDA 11.7):
conda install pytorch torchvision torchaudio cudatoolkit=11.7 -c pytorch
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
在Python解释器中运行以下代码,检查PyTorch是否能够检测到CUDA:
import torch
print(torch.__version__)
print(torch.cuda.is_available())
如果输出为True,则表示PyTorch和CUDA适配成功。
通过以上步骤,你可以在Linux系统中成功安装PyTorch与CUDA,从而利用GPU加速深度学习模型的训练和推理。如果在安装过程中遇到问题,可以参考PyTorch官方文档或相关社区论坛寻求帮助。