您好,登录后才能下订单哦!
在深度学习领域,PyTorch 是一个非常流行的框架,而 Google Colab 则提供了一个免费的云端环境,可以方便地进行深度学习模型的训练。本文将详细介绍如何使用 PyTorch 在 Google Colab 上训练神经网络。
首先,打开 Google Colab,点击“新建笔记本”创建一个新的笔记本。你可以选择使用 Python 3 作为运行时环境。
Google Colab 默认已经安装了 PyTorch,但如果你想确保使用的是最新版本,可以运行以下命令来安装或更新 PyTorch:
!pip install torch torchvision
在开始训练之前,我们需要导入一些必要的库:
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
我们将使用 CIFAR-10 数据集作为示例。CIFAR-10 是一个包含 10 个类别的图像分类数据集,每个类别有 6000 张 32x32 的彩色图像。
transform = transforms.Compose([
transforms.ToTensor(),
transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))
])
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
test_dataset = datasets.CIFAR10(root='./data', train=False, download=True, transform=transform)
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)
为了确保数据加载正确,我们可以可视化一些图像:
import matplotlib.pyplot as plt
import numpy as np
def imshow(img):
img = img / 2 + 0.5 # 反归一化
npimg = img.numpy()
plt.imshow(np.transpose(npimg, (1, 2, 0)))
plt.show()
# 获取一些训练图像
dataiter = iter(train_loader)
images, labels = dataiter.next()
# 显示图像
imshow(torchvision.utils.make_grid(images))
我们将构建一个简单的卷积神经网络(CNN):
class SimpleCNN(nn.Module):
def __init__(self):
super(SimpleCNN, self).__init__()
self.conv1 = nn.Conv2d(3, 32, 3, 1)
self.conv2 = nn.Conv2d(32, 64, 3, 1)
self.fc1 = nn.Linear(64 * 6 * 6, 128)
self.fc2 = nn.Linear(128, 10)
def forward(self, x):
x = F.relu(self.conv1(x))
x = F.max_pool2d(x, 2)
x = F.relu(self.conv2(x))
x = F.max_pool2d(x, 2)
x = x.view(-1, 64 * 6 * 6)
x = F.relu(self.fc1(x))
x = self.fc2(x)
return x
model = SimpleCNN()
我们将使用交叉熵损失函数和随机梯度下降(SGD)优化器:
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)
我们将训练模型 10 个 epoch:
num_epochs = 10
for epoch in range(num_epochs):
model.train()
running_loss = 0.0
for i, data in enumerate(train_loader, 0):
inputs, labels = data
optimizer.zero_grad()
outputs = model(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss += loss.item()
if i % 100 == 99: # 每 100 个 batch 打印一次损失
print(f'Epoch [{epoch + 1}/{num_epochs}], Step [{i + 1}/{len(train_loader)}], Loss: {running_loss / 100:.4f}')
running_loss = 0.0
在训练完成后,我们可以测试模型的性能:
model.eval()
correct = 0
total = 0
with torch.no_grad():
for data in test_loader:
images, labels = data
outputs = model(images)
_, predicted = torch.max(outputs.data, 1)
total += labels.size(0)
correct += (predicted == labels).sum().item()
print(f'Accuracy of the model on the 10000 test images: {100 * correct / total:.2f}%')
训练完成后,我们可以将模型保存到磁盘:
torch.save(model.state_dict(), 'simple_cnn.pth')
如果需要加载模型,可以使用以下代码:
model = SimpleCNN()
model.load_state_dict(torch.load('simple_cnn.pth'))
model.eval()
Google Colab 提供了免费的 GPU 资源,我们可以通过以下代码将模型和数据移动到 GPU 上:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)
在训练和测试时,记得将数据也移动到 GPU 上:
inputs, labels = inputs.to(device), labels.to(device)
通过本文,我们学习了如何在 Google Colab 上使用 PyTorch 训练一个简单的卷积神经网络。Google Colab 提供了免费的 GPU 资源,使得深度学习模型的训练变得更加高效。希望本文对你有所帮助,祝你在深度学习的旅程中取得成功!
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。