Linux下怎么安装CUDA

发布时间:2022-02-10 14:53:37 作者:iii
来源:亿速云 阅读:585
# Linux下怎么安装CUDA

## 前言

CUDA(Compute Unified Device Architecture)是NVIDIA推出的并行计算平台和编程模型,它允许开发者利用NVIDIA GPU的强大计算能力加速各种计算密集型任务。在科学计算、深度学习、图形渲染等领域,CUDA已经成为不可或缺的工具。

本文将详细介绍在Linux系统下安装CUDA的完整流程,涵盖从系统准备到验证安装的各个环节,并提供常见问题的解决方案。

## 目录

1. [准备工作](#准备工作)
   - [硬件要求](#硬件要求)
   - [软件要求](#软件要求)
   - [验证GPU兼容性](#验证gpu兼容性)
2. [安装方法](#安装方法)
   - [方法一:使用官方.run文件安装](#方法一使用官方run文件安装)
   - [方法二:使用包管理器安装](#方法二使用包管理器安装)
3. [环境配置](#环境配置)
4. [验证安装](#验证安装)
5. [常见问题解决](#常见问题解决)
6. [卸载CUDA](#卸载cuda)
7. [总结](#总结)

## 准备工作

### 硬件要求

- NVIDIA显卡:确保您的显卡支持CUDA。可以访问[NVIDIA CUDA GPU列表](https://developer.nvidia.com/cuda-gpus)查询兼容性
- 足够的磁盘空间:CUDA工具包通常需要2-5GB空间
- 系统内存:建议至少8GB

### 软件要求

- Linux发行版:Ubuntu、CentOS、RHEL等主流发行版
- GCC编译器:通常已预装,可通过`gcc --version`检查
- 内核头文件和开发包:
  ```bash
  # Ubuntu/Debian
  sudo apt-get install linux-headers-$(uname -r)
  
  # RHEL/CentOS
  sudo yum install kernel-devel-$(uname -r)

验证GPU兼容性

lspci | grep -i nvidia

输出应显示您的NVIDIA显卡型号。如果没有显示,可能需要: 1. 检查显卡是否正确安装 2. 启用BIOS中的显卡设置 3. 安装NVIDIA驱动

安装方法

方法一:使用官方.run文件安装

  1. 下载CUDA工具包: 访问NVIDIA CUDA下载页面,选择:
    • 操作系统:Linux
    • 架构:x86_64
    • 发行版:根据您的系统选择
    • 版本:建议选择最新稳定版
    • 安装类型:选择”runfile(local)”

或直接使用wget:

   wget https://developer.download.nvidia.com/compute/cuda/12.2.2/local_installers/cuda_12.2.2_535.104.05_linux.run
  1. 关闭图形界面(推荐):

    sudo systemctl isolate multi-user.target
    
  2. 运行安装程序

    sudo sh cuda_<version>_linux.run
    

    安装过程中:

    • 接受许可协议
    • 取消勾选驱动安装(如果已安装最新驱动)
    • 确保选中CUDA Toolkit
  3. 恢复图形界面

    sudo systemctl start graphical.target
    

方法二:使用包管理器安装

Ubuntu/Debian系统:

  1. 添加NVIDIA仓库密钥:

    sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/3bf863cc.pub
    
  2. 添加仓库:

    sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/<distro>/x86_64/ /"
    
  3. 安装CUDA:

    sudo apt-get update
    sudo apt-get install cuda
    

RHEL/CentOS系统:

  1. 添加仓库:

    sudo dnf config-manager --add-repo https://developer.download.nvidia.com/compute/cuda/repos/rhel8/x86_64/cuda-rhel8.repo
    
  2. 安装CUDA:

    sudo dnf clean all
    sudo dnf -y install cuda
    

环境配置

  1. 添加PATH变量: 在~/.bashrc~/.zshrc末尾添加:

    export PATH=/usr/local/cuda/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
    

    然后执行:

    source ~/.bashrc
    
  2. 验证环境变量

    echo $PATH | grep cuda
    nvcc --version
    
  3. 安装cuDNN(可选): 如需深度学习开发,还需安装NVIDIA cuDNN

    sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
    sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
    sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*
    

验证安装

  1. 编译运行示例程序

    cd /usr/local/cuda/samples/1_Utilities/deviceQuery
    make
    ./deviceQuery
    

    输出应显示”Result = PASS”。

  2. 查看GPU信息

    nvidia-smi
    

    输出示例:

    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 535.104.05   Driver Version: 535.104.05   CUDA Version: 12.2     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  NVIDIA GeForce ...  On   | 00000000:01:00.0  On |                  N/A |
    | N/A   45C    P8    N/A /  N/A |    500MiB /  8192MiB |      0%      Default |
    |                               |                      |                  N/A |
    +-------------------------------+----------------------+----------------------+
    
  3. 测试矩阵乘法

    cd /usr/local/cuda/samples/0_Simple/matrixMul
    make
    ./matrixMul
    

常见问题解决

  1. 驱动版本不兼容

    ERROR: Unable to load the 'nvidia-drm' kernel module
    

    解决方案:

    sudo apt-get purge nvidia*
    sudo add-apt-repository ppa:graphics-drivers/ppa
    sudo apt-get update
    sudo apt-get install nvidia-driver-535
    
  2. 缺少依赖项

    Missing recommended library: libfreeimage3
    

    解决方案:

    sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
    
  3. GPU未被识别

    ./deviceQuery: no CUDA-capable device is detected
    

    检查:

    • 显卡是否正确安装
    • 驱动是否正确加载(lsmod | grep nvidia
    • BIOS中是否禁用了集成显卡
  4. 多版本CUDA管理: 使用update-alternatives管理多个版本:

    sudo update-alternatives --install /usr/local/cuda cuda /usr/local/cuda-12.2 100
    sudo update-alternatives --config cuda
    

卸载CUDA

  1. .run安装方式卸载

    sudo /usr/local/cuda/bin/uninstall_cuda_12.2.pl
    
  2. apt安装方式卸载

    sudo apt-get --purge remove "*cuda*" "*cublas*" "*cufft*" "*cufile*" "*curand*" "*cusolver*" "*cusparse*" "*gds-tools*" "*npp*" "*nvjpeg*" "nsight*"
    
  3. 手动清理

    sudo rm -rf /usr/local/cuda*
    

总结

在Linux系统上安装CUDA需要经过以下几个关键步骤:

  1. 前期准备:确认硬件兼容性、安装必要依赖
  2. 驱动安装:确保使用与CUDA版本匹配的NVIDIA驱动
  3. CUDA安装:通过.run文件或包管理器安装
  4. 环境配置:设置PATH和库路径
  5. 验证测试:编译运行示例程序确认安装成功

建议开发者: - 定期检查NVIDIA官方文档获取最新信息 - 使用虚拟环境(如conda)管理不同版本的CUDA工具包 - 关注系统升级可能带来的驱动兼容性问题

通过本文的指导,您应该能够顺利完成CUDA的安装并开始GPU加速计算之旅。如在安装过程中遇到特殊问题,可参考NVIDIA官方论坛或社区寻求帮助。 “`

这篇文章提供了约3500字的详细指南,采用Markdown格式编写,包含: - 多级标题结构 - 代码块形式的命令示例 - 清晰的步骤分解 - 常见问题解决方案 - 多种安装方法比较 - 环境配置说明 - 验证和卸载指南

您可以根据实际需要调整内容细节或添加特定发行版的说明。

推荐阅读:
  1. Linux下安装Redis及Linux下php安装Redis扩展
  2. windows 10下安装cuda9.2总结

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

linux cuda

上一篇:Linux的fsck命令有什么用

下一篇:Linux下如何安装和使用ClamAV

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》