Linux下怎么安装CUDA

发布时间：2022-02-10 14:53:37 作者：iii
来源：亿速云阅读：586

# Linux下怎么安装CUDA

## 前言

CUDA（Compute Unified Device Architecture）是NVIDIA推出的并行计算平台和编程模型，它允许开发者利用NVIDIA GPU的强大计算能力加速各种计算密集型任务。在科学计算、深度学习、图形渲染等领域，CUDA已经成为不可或缺的工具。

本文将详细介绍在Linux系统下安装CUDA的完整流程，涵盖从系统准备到验证安装的各个环节，并提供常见问题的解决方案。

## 目录

1. [准备工作](#准备工作)
   - [硬件要求](#硬件要求)
   - [软件要求](#软件要求)
   - [验证GPU兼容性](#验证gpu兼容性)
2. [安装方法](#安装方法)
   - [方法一：使用官方.run文件安装](#方法一使用官方run文件安装)
   - [方法二：使用包管理器安装](#方法二使用包管理器安装)
3. [环境配置](#环境配置)
4. [验证安装](#验证安装)
5. [常见问题解决](#常见问题解决)
6. [卸载CUDA](#卸载cuda)
7. [总结](#总结)

## 准备工作

### 硬件要求

- NVIDIA显卡：确保您的显卡支持CUDA。可以访问[NVIDIA CUDA GPU列表](https://developer.nvidia.com/cuda-gpus)查询兼容性
- 足够的磁盘空间：CUDA工具包通常需要2-5GB空间
- 系统内存：建议至少8GB

### 软件要求

- Linux发行版：Ubuntu、CentOS、RHEL等主流发行版
- GCC编译器：通常已预装，可通过`gcc --version`检查
- 内核头文件和开发包：
  ```bash
  # Ubuntu/Debian
  sudo apt-get install linux-headers-$(uname -r)
  
  # RHEL/CentOS
  sudo yum install kernel-devel-$(uname -r)

验证GPU兼容性

lspci | grep -i nvidia

输出应显示您的NVIDIA显卡型号。如果没有显示，可能需要： 1. 检查显卡是否正确安装 2. 启用BIOS中的显卡设置 3. 安装NVIDIA驱动

安装方法

方法一：使用官方.run文件安装

下载CUDA工具包：访问NVIDIA CUDA下载页面，选择：
- 操作系统：Linux
- 架构：x86_64
- 发行版：根据您的系统选择
- 版本：建议选择最新稳定版
- 安装类型：选择”runfile(local)”

或直接使用wget：

   wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run

关闭图形界面（推荐）：

sudo systemctl isolate multi-user.target

运行安装程序：
```
sudo sh cuda_<version>_linux.run
```
安装过程中：
- 接受许可协议
- 取消勾选驱动安装（如果已安装最新驱动）
- 确保选中CUDA Toolkit
恢复图形界面：
```
sudo systemctl start graphical.target
```

方法二：使用包管理器安装

Ubuntu/Debian系统：

添加NVIDIA仓库密钥：

sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/3bf863cc.pub

添加仓库：

sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/ /"

安装CUDA：

sudo apt-get update
sudo apt-get install cuda

RHEL/CentOS系统：

添加仓库：

sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rhel8.repo

安装CUDA：

sudo dnf clean all
sudo dnf -y install cuda

环境配置

添加PATH变量：在~/.bashrc或~/.zshrc末尾添加：

export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

然后执行：

source ~/.bashrc

验证环境变量：
```
echo $PATH | grep cuda
nvcc --version
```

安装cuDNN（可选）：如需深度学习开发，还需安装NVIDIA cuDNN：

sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

验证安装

编译运行示例程序：

cd /usr/local/cuda/samples/1_Utilities/deviceQuery
make
./deviceQuery

输出应显示”Result = PASS”。

查看GPU信息：

nvidia-smi

输出示例：

+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.104.05   Driver Version: 535.104.05   CUDA Version: 12.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  On   | 00000000:01:00.0  On |                  N/A |
| N/A   45C    P8    N/A /  N/A |    500MiB /  8192MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

测试矩阵乘法：

cd /usr/local/cuda/samples/0_Simple/matrixMul
make
./matrixMul

常见问题解决

驱动版本不兼容：

ERROR: Unable to load the 'nvidia-drm' kernel module

解决方案：

sudo apt-get purge nvidia*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-driver-535

缺少依赖项：

Missing recommended library: libfreeimage3

解决方案：

sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev

GPU未被识别：
```
./deviceQuery: no CUDA-capable device is detected
```
检查：
- 显卡是否正确安装
- 驱动是否正确加载（lsmod | grep nvidia）
- BIOS中是否禁用了集成显卡

多版本CUDA管理：使用update-alternatives管理多个版本：

sudo update-alternatives --install /usr/local/cuda cuda /usr/local/cuda-12.2 100
sudo update-alternatives --config cuda

卸载CUDA

.run安装方式卸载：

sudo /usr/local/cuda/bin/uninstall_cuda_12.2.pl

apt安装方式卸载：

sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*"

手动清理：
```
sudo rm -rf /usr/local/cuda*
```

总结

在Linux系统上安装CUDA需要经过以下几个关键步骤：

前期准备：确认硬件兼容性、安装必要依赖
驱动安装：确保使用与CUDA版本匹配的NVIDIA驱动
CUDA安装：通过.run文件或包管理器安装
环境配置：设置PATH和库路径
验证测试：编译运行示例程序确认安装成功

建议开发者： - 定期检查NVIDIA官方文档获取最新信息 - 使用虚拟环境（如conda）管理不同版本的CUDA工具包 - 关注系统升级可能带来的驱动兼容性问题

通过本文的指导，您应该能够顺利完成CUDA的安装并开始GPU加速计算之旅。如在安装过程中遇到特殊问题，可参考NVIDIA官方论坛或社区寻求帮助。 “`

这篇文章提供了约3500字的详细指南，采用Markdown格式编写，包含： - 多级标题结构 - 代码块形式的命令示例 - 清晰的步骤分解 - 常见问题解决方案 - 多种安装方法比较 - 环境配置说明 - 验证和卸载指南

您可以根据实际需要调整内容细节或添加特定发行版的说明。