您好,登录后才能下订单哦!
# Linux下怎么安装CUDA
## 前言
CUDA(Compute Unified Device Architecture)是NVIDIA推出的并行计算平台和编程模型,它允许开发者利用NVIDIA GPU的强大计算能力加速各种计算密集型任务。在科学计算、深度学习、图形渲染等领域,CUDA已经成为不可或缺的工具。
本文将详细介绍在Linux系统下安装CUDA的完整流程,涵盖从系统准备到验证安装的各个环节,并提供常见问题的解决方案。
## 目录
1. [准备工作](#准备工作)
- [硬件要求](#硬件要求)
- [软件要求](#软件要求)
- [验证GPU兼容性](#验证gpu兼容性)
2. [安装方法](#安装方法)
- [方法一:使用官方.run文件安装](#方法一使用官方run文件安装)
- [方法二:使用包管理器安装](#方法二使用包管理器安装)
3. [环境配置](#环境配置)
4. [验证安装](#验证安装)
5. [常见问题解决](#常见问题解决)
6. [卸载CUDA](#卸载cuda)
7. [总结](#总结)
## 准备工作
### 硬件要求
- NVIDIA显卡:确保您的显卡支持CUDA。可以访问[NVIDIA CUDA GPU列表](https://developer.nvidia.com/cuda-gpus)查询兼容性
- 足够的磁盘空间:CUDA工具包通常需要2-5GB空间
- 系统内存:建议至少8GB
### 软件要求
- Linux发行版:Ubuntu、CentOS、RHEL等主流发行版
- GCC编译器:通常已预装,可通过`gcc --version`检查
- 内核头文件和开发包:
```bash
# Ubuntu/Debian
sudo apt-get install linux-headers-$(uname -r)
# RHEL/CentOS
sudo yum install kernel-devel-$(uname -r)
lspci | grep -i nvidia
输出应显示您的NVIDIA显卡型号。如果没有显示,可能需要: 1. 检查显卡是否正确安装 2. 启用BIOS中的显卡设置 3. 安装NVIDIA驱动
或直接使用wget:
wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run
关闭图形界面(推荐):
sudo systemctl isolate multi-user.target
运行安装程序:
sudo sh cuda_<version>_linux.run
安装过程中:
恢复图形界面:
sudo systemctl start graphical.target
添加NVIDIA仓库密钥:
sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/3bf863cc.pub
添加仓库:
sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/ /"
安装CUDA:
sudo apt-get update
sudo apt-get install cuda
添加仓库:
sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rhel8.repo
安装CUDA:
sudo dnf clean all
sudo dnf -y install cuda
添加PATH变量:
在~/.bashrc
或~/.zshrc
末尾添加:
export PATH=/usr/local/cuda/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
然后执行:
source ~/.bashrc
验证环境变量:
echo $PATH | grep cuda
nvcc --version
安装cuDNN(可选): 如需深度学习开发,还需安装NVIDIA cuDNN:
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
编译运行示例程序:
cd /usr/local/cuda/samples/1_Utilities/deviceQuery
make
./deviceQuery
输出应显示”Result = PASS”。
查看GPU信息:
nvidia-smi
输出示例:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 535.104.05 Driver Version: 535.104.05 CUDA Version: 12.2 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|===============================+======================+======================|
| 0 NVIDIA GeForce ... On | 00000000:01:00.0 On | N/A |
| N/A 45C P8 N/A / N/A | 500MiB / 8192MiB | 0% Default |
| | | N/A |
+-------------------------------+----------------------+----------------------+
测试矩阵乘法:
cd /usr/local/cuda/samples/0_Simple/matrixMul
make
./matrixMul
驱动版本不兼容:
ERROR: Unable to load the 'nvidia-drm' kernel module
解决方案:
sudo apt-get purge nvidia*
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-driver-535
缺少依赖项:
Missing recommended library: libfreeimage3
解决方案:
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
GPU未被识别:
./deviceQuery: no CUDA-capable device is detected
检查:
lsmod | grep nvidia
)多版本CUDA管理:
使用update-alternatives
管理多个版本:
sudo update-alternatives --install /usr/local/cuda cuda /usr/local/cuda-12.2 100
sudo update-alternatives --config cuda
.run安装方式卸载:
sudo /usr/local/cuda/bin/uninstall_cuda_12.2.pl
apt安装方式卸载:
sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*"
手动清理:
sudo rm -rf /usr/local/cuda*
在Linux系统上安装CUDA需要经过以下几个关键步骤:
建议开发者: - 定期检查NVIDIA官方文档获取最新信息 - 使用虚拟环境(如conda)管理不同版本的CUDA工具包 - 关注系统升级可能带来的驱动兼容性问题
通过本文的指导,您应该能够顺利完成CUDA的安装并开始GPU加速计算之旅。如在安装过程中遇到特殊问题,可参考NVIDIA官方论坛或社区寻求帮助。 “`
这篇文章提供了约3500字的详细指南,采用Markdown格式编写,包含: - 多级标题结构 - 代码块形式的命令示例 - 清晰的步骤分解 - 常见问题解决方案 - 多种安装方法比较 - 环境配置说明 - 验证和卸载指南
您可以根据实际需要调整内容细节或添加特定发行版的说明。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。