pytorch怎么训练自己的数据集 - 问答

要训练自己的数据集，首先需要将数据加载到PyTorch的Dataset中，并创建一个对应的DataLoader来对数据进行批处理和加载。然后定义一个神经网络模型，定义损失函数和优化器，并在训练循环中迭代数据并更新模型参数。以下是一个简单的示例代码：

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, Dataset

# 定义自己的数据集类
class CustomDataset(Dataset):
    def __init__(self, data):
        self.data = data

    def __len__(self):
        return len(self.data)

    def __getitem__(self, idx):
        return self.data[idx]

# 定义神经网络模型
class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.fc = nn.Linear(10, 1) # 输入特征维度为10

    def forward(self, x):
        return self.fc(x)

# 加载数据集
data = torch.randn(100, 10)
dataset = CustomDataset(data)
dataloader = DataLoader(dataset, batch_size=10, shuffle=True)

# 定义模型、损失函数和优化器
model = Model()
criterion = nn.MSELoss()
optimizer = optim.SGD(model.parameters(), lr=0.001)

# 训练模型
num_epochs = 10
for epoch in range(num_epochs):
    for batch_idx, batch_data in enumerate(dataloader):
        optimizer.zero_grad()
        output = model(batch_data)
        loss = criterion(output, torch.ones(batch_data.size(0))) # 目标值为1
        loss.backward()
        optimizer.step()

        if batch_idx % 10 == 0:
            print('Epoch [{}/{}], Batch [{}/{}], Loss: {:.4f}'
                  .format(epoch+1, num_epochs, batch_idx, len(dataloader), loss.item()))

在上面的示例中，我们定义了一个简单的自定义数据集类和神经网络模型类。然后加载数据集，定义模型、损失函数和优化器，并进行训练。在训练循环中，我们迭代数据加载器中的每个批次数据，并计算损失、反向传播、更新模型参数。您可以根据您的数据集和模型的具体情况进行适当的调整和修改。

0 赞

0 踩