centos

如何在CentOS上构建PyTorch框架

小樊
40
2025-12-21 18:32:56
栏目: 智能运维

在CentOS上构建PyTorch框架需要遵循一系列步骤,包括安装依赖项、下载源代码、编译和安装。以下是一个基本的指南:

1. 安装依赖项

首先,确保你的系统是最新的,并且安装了必要的开发工具和库。

sudo yum update -y
sudo yum groupinstall -y "Development Tools"
sudo yum install -y cmake3 git python3 python3-devel numpy

2. 安装CUDA(如果需要GPU支持)

如果你打算使用GPU加速,你需要安装CUDA Toolkit。可以从NVIDIA官网下载适合你GPU型号的CUDA Toolkit。

# 下载CUDA Toolkit(以CUDA 11.7为例)
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run

# 运行安装程序
sudo sh cuda_11.7.0_515.43.04_linux.run

# 按照提示完成安装

安装完成后,添加CUDA路径到环境变量:

echo 'export PATH=/usr/local/cuda-11.7/bin:$PATH' >> ~/.bashrc
echo 'export LD_LIBRARY_PATH=/usr/local/cuda-11.7/lib64:$LD_LIBRARY_PATH' >> ~/.bashrc
source ~/.bashrc

3. 安装cuDNN(如果需要GPU支持)

cuDNN是用于深度神经网络的GPU加速库。你需要从NVIDIA官网下载并安装与CUDA版本兼容的cuDNN。

# 下载cuDNN(以cuDNN 8.2.2 for CUDA 11.7为例)
wget https://developer.nvidia.com/compute/machine-learning/cudnn/secure/8.2.2/11.7_20210301/cudnn-11.7-linux-x64-v8.2.2.26.tgz

# 解压文件
tar -xzvf cudnn-11.7-linux-x64-v8.2.2.26.tgz

# 将文件复制到CUDA目录
sudo cp cuda/include/cudnn*.h /usr/local/cuda/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

4. 下载PyTorch源代码

从GitHub上克隆PyTorch仓库:

git clone --recursive https://github.com/pytorch/pytorch
cd pytorch

5. 安装Python依赖项

安装构建PyTorch所需的Python包:

pip3 install -r requirements.txt

6. 设置环境变量

设置一些环境变量以确保构建过程正确:

export CMAKE_PREFIX_PATH=${CONDA_PREFIX:-"$(dirname $(which python))/../"}
export USE_CUDA=1
export USE_CUDNN=1

7. 编译PyTorch

使用CMake进行编译。你可以选择性地启用或禁用某些功能,例如MKL支持、OpenMP等。

python3 setup.py install

或者,如果你想使用更高级的构建系统,可以使用torch.utils.build模块:

python3 -m torch.utils.build

8. 验证安装

安装完成后,你可以验证PyTorch是否正确安装:

import torch
print(torch.__version__)
print(torch.cuda.is_available())  # 如果安装了CUDA,应该返回True

注意事项

以上步骤应该可以帮助你在CentOS上成功构建PyTorch框架。

0
看了该问题的人还看了