PyTorch Linux开发环境搭建
小樊
36
2025-11-16 22:00:16
PyTorch Linux开发环境搭建
一 环境准备与系统依赖
- 更新系统并安装基础工具(以发行版为准):
- Debian/Ubuntu:
- sudo apt update && sudo apt upgrade -y
- sudo apt install -y build-essential cmake git libopenblas-dev liblapack-dev libjpeg-dev libpng-dev libtiff-dev libavcodec-dev libavformat-dev libswscale-dev python3-dev python3-pip
- CentOS/RHEL:
- sudo yum update -y
- sudo yum groupinstall -y “Development Tools”
- sudo yum install -y cmake3 git wget python3 python3-devel python3-pip
- 确认 Python 与 pip:
- python3 --version、pip3 --version
- 建议升级 pip:pip3 install --upgrade pip
- 可选但强烈推荐:使用虚拟环境隔离依赖(见下一节)。
二 创建虚拟环境与安装 PyTorch
- 方式一 使用 venv(系统自带,轻量)
- 创建并激活:
- python3 -m venv pytorch_env
- source pytorch_env/bin/activate
- 安装命令(按硬件选择其一):
- CPU:pip3 install torch torchvision torchaudio
- GPU(示例为 CUDA 11.8,请将 cu118 替换为你的 CUDA 大版本):pip3 install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu118
- 方式二 使用 Conda(Anaconda/Miniconda,依赖管理更强)
- 安装 Miniconda(示例):
- wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
- bash Miniconda3-latest-Linux-x86_64.sh(按提示完成)
- source ~/.bashrc
- 创建并激活环境(示例 Python 3.8/3.10):
- conda create -n pytorch_env python=3.8
- conda activate pytorch_env
- 安装命令(按硬件选择其一):
- CPU:conda install pytorch torchvision torchaudio cpuonly -c pytorch
- GPU(示例为 cudatoolkit 11.8):conda install pytorch torchvision torchaudio cudatoolkit=11.8 -c pytorch -c nvidia
- 说明:GPU 版本需确保系统已安装与所选 PyTorch 版本匹配的 CUDA/cuDNN;若使用 conda,常用做法是让 conda 管理 cudatoolkit,避免与系统 CUDA 冲突。
三 GPU 支持与驱动检查
- 查看驱动与 CUDA 运行时版本:
- nvidia-smi(右上显示 Supported/Runtime CUDA)
- 安装与配置要点(仅当使用 NVIDIA GPU 时):
- 安装与驱动匹配的 CUDA Toolkit 与 cuDNN,并设置环境变量(示例路径,按实际版本调整):
- echo ‘export PATH=/usr/local/cuda-11.7/bin:$PATH’ >> ~/.bashrc
- echo ‘export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH’ >> ~/.bashrc
- source ~/.bashrc
- 选择与 nvidia-smi 显示的 CUDA 大版本一致的 PyTorch 版本(例如 11.7/11.8),避免不兼容导致 torch.cuda.is_available() 为 False。
四 验证安装与常见问题
- 基础验证:
- python3 - <<‘PY’
import torch, torchvision, torchaudio
print(“torch:”, torch.version, “torchvision:”, torchvision.version, “torchaudio:”, torchaudio.version)
print(“cuda available:”, torch.cuda.is_available())
if torch.cuda.is_available():
print(“device count:”, torch.cuda.device_count())
print(“current device:”, torch.cuda.current_device())
print(“device name:”, torch.cuda.get_device_name())
PY
- 常见问题与处理:
- 网络慢/超时:使用国内镜像(如清华源)pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名;或 conda 配置清华通道(注意与默认通道的兼容性)。
- CUDA 不可用:核对 nvidia-smi 与 PyTorch 的 CUDA 大版本一致;如使用 conda 安装 GPU 版,优先使用 cudatoolkit 而非系统 CUDA;必要时重装驱动/cuDNN 并重启。
- 依赖缺失:按第一节补齐系统库与 Python 开发包;编译/安装额外包时确保已安装 cmake、gcc/g++ 等工具。
五 IDE 与日常开发配置
- PyCharm:File → Settings → Project → Python Interpreter → Add → 选择虚拟环境的解释器(如 pytorch_env/bin/python)。
- VS Code:Ctrl+Shift+P → Python: Select Interpreter → 选择虚拟环境解释器;确保终端激活了对应环境(which python 应指向 venv 或 conda env)。
- 常用加速与调试建议:
- 优先使用 conda 管理二进制依赖,避免 pip 与系统库冲突。
- 固定版本:在 requirements.txt 或 environment.yml 中锁定 torch/torchvision/torchaudio 与 python 版本,便于复现实验。