Linux如何使用PyTorch进行模型训练 - 问答

在Linux系统上使用PyTorch进行模型训练，可以按照以下步骤进行：

1. 安装PyTorch

首先，确保你已经安装了Python和pip。然后，根据你的CUDA版本（如果使用GPU）选择合适的PyTorch安装命令。你可以从PyTorch官网获取最新的安装命令。

使用pip安装（CPU版本）

pip install torch torchvision torchaudio

使用pip安装（GPU版本，CUDA 11.3）

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113

2. 准备数据集

你需要准备训练数据和验证数据。可以使用PyTorch提供的torchvision库来加载和处理数据集。

import torchvision.transforms as transforms
import torchvision.datasets as datasets

# 定义数据预处理
transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
])

# 加载数据集
train_dataset = datasets.ImageFolder('path/to/train', transform=transform)
val_dataset = datasets.ImageFolder('path/to/val', transform=transform)

# 创建数据加载器
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = torch.utils.data.DataLoader(val_dataset, batch_size=32, shuffle=False)

3. 定义模型

你可以使用PyTorch提供的预训练模型，或者自己定义一个模型。

import torch.nn as nn
import torchvision.models as models

# 加载预训练模型
model = models.resnet18(pretrained=True)

# 修改最后一层以适应你的数据集
num_ftrs = model.fc.in_features
model.fc = nn.Linear(num_ftrs, len(train_dataset.classes))

4. 定义损失函数和优化器

import torch.optim as optim

# 定义损失函数
criterion = nn.CrossEntropyLoss()

# 定义优化器
optimizer = optim.Adam(model.parameters(), lr=0.001)

5. 训练模型

import torch

num_epochs = 10

for epoch in range(num_epochs):
    model.train()
    running_loss = 0.0
    for images, labels in train_loader:
        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()
        running_loss += loss.item()
    
    print(f'Epoch {epoch+1}/{num_epochs}, Loss: {running_loss/len(train_loader)}')

    # 验证模型
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for images, labels in val_loader:
            outputs = model(images)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    
    print(f'Validation Accuracy: {100 * correct / total}%')

6. 保存模型

torch.save(model.state_dict(), 'model.pth')

7. 加载模型

model.load_state_dict(torch.load('model.pth'))

以上步骤涵盖了在Linux系统上使用PyTorch进行模型训练的基本流程。根据具体需求，你可以进一步调整和优化代码。

0 赞

0 踩