CUDA版本不匹配
nvidia-smi和nvcc --version确认系统CUDA版本。# 例如CUDA 11.7对应的PyTorch安装命令
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
```。
export CUDA_HOME=/usr/local/cuda-<版本号>
export PATH=$CUDA_HOME/bin:$PATH
export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH
```。
依赖库缺失或冲突
numpy、scipy等依赖库,或版本冲突。pip install numpy scipy。conda管理环境,避免全局依赖冲突:conda create -n pytorch_env python=3.8
conda activate pytorch_env
conda install pytorch torchvision torchaudio cudatoolkit=<版本号>
```。
Python版本不兼容
python3 -m venv pytorch_env
source pytorch_env/bin/activate
```。
权限或安装错误
pip install时出现权限不足或网络超时。sudo提升权限,或通过国内镜像源加速下载:pip install --user torch torchvision -i https://pypi.tuna.tsinghua.edu.cn/simple
```。
运行时设备错误
print(torch.cuda.is_available()),返回True则配置正确。device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model = model.to(device)
data = data.to(device)
```。
驱动与CUDA工具包冲突
nvidia-smi检查驱动版本,或从NVIDIA官网下载对应驱动安装包。内存不足或显存溢出
batch_size或使用梯度累积。del tensor,并调用torch.cuda.empty_cache()。版本兼容性导致的API错误
pip install torch==<旧版本号>回退版本。import torch
print(torch.__version__) # 查看PyTorch版本
print(torch.cuda.is_available()) # 检查GPU是否可用
```。
sudo yum update,确保依赖库为最新版本。参考来源: