1. 版本兼容性问题
nvcc --version查看系统CUDA版本,选择匹配的PyTorch安装命令(如conda install pytorch torchvision torchaudio cudatoolkit=11.8 -c pytorch);或使用PyTorch官网提供的版本兼容表选择对应版本。conda create -n pytorch_env python=3.8),再在其中安装PyTorch。2. 安装过程中的常见问题
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/)或pip镜像(pip install torch -i https://pypi.tuna.tsinghua.edu.cn/simple)。build-essential、libopenblas-dev)。解决方法:根据系统类型安装依赖(Debian/Ubuntu:sudo apt install -y build-essential cmake git libopenblas-dev;CentOS/RHEL:sudo yum groupinstall "Development Tools")。3. 运行时的常见错误
conda activate env_name),重新安装PyTorch(pip install torch torchvision torchaudio)。LD_LIBRARY_PATH(如export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH),并写入.bashrc使其永久生效。nvidia-smi),选择支持该架构的PyTorch版本(如较新的PyTorch版本支持更老的GPU架构)。nvidia-smi查看驱动支持的CUDA版本,确保PyTorch安装的CUDA版本与驱动匹配;检查代码中设备指定逻辑(如device = torch.device("cuda" if torch.cuda.is_available() else "cpu"))。4. 其他常见问题
nvcc --version),安装匹配的cuDNN(从NVIDIA官网下载对应版本的cuDNN库)。conda create -n pytorch_env python=3.8,conda activate pytorch_env),再在其中安装PyTorch。