在 Ubuntu 上安装 TensorFlow 的完整指南
一 环境准备与版本选择
nvidia-smi 查看驱动与最高支持的 CUDA 版本。二 原生 pip 安装步骤(CPU 或 GPU)
python3 -m venv tf-env && source tf-env/bin/activateconda create -n tf-env python=3.9 -y && conda activate tf-envpip install -U pippip install tensorflow(自 2.x 起该包同时包含 CPU 与 GPU 支持,实际是否启用 GPU 取决于系统是否配置好 CUDA/cuDNN 与驱动)。pip install tensorflow-gpu,但务必与 CUDA/cuDNN 版本匹配。python - <<'PY' import tensorflow as tf print("TF version:", tf.__version__) print("GPUs:", tf.config.list_physical_devices("GPU")) PY三 GPU 支持与 Docker 方式(更省心)
nvidia-container-toolkit)。docker run --gpus all --rm nvidia/cuda nvidia-smidocker pull tensorflow/tensorflow:latest-gpu-jupyterdocker run -it -p 8888:8888 tensorflow/tensorflow:latest-gpu-jupyter--restart=always --name tf-gpu 等参数。该方式隔离性好、依赖冲突少,适合快速上手与复现实验。四 常见问题与排查
nvidia-smi 确认驱动正常且支持的 CUDA 版本;TensorFlow 与 CUDA/cuDNN 版本必须匹配(如 2.12→CUDA 11.8/cuDNN 8.6,2.13+→CUDA 12.1/cuDNN 8.9)。libcudart.so),检查并设置环境变量:
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATHexport CUDA_HOME=/usr/local/cudatf.config.list_physical_devices('GPU') 是否返回设备;若为空,优先检查驱动、CUDA/cuDNN 版本匹配与容器运行时配置。batch_size、启用内存按需增长:
gpus = tf.config.experimental.list_physical_devices('GPU')tf.config.experimental.set_memory_growth(gpus[0], True)pip install 与运行 python。以上排查思路覆盖最常见的驱动、版本与资源问题。