为什么梯度下降在pytorch中无法如预期般运行

import torch import torch.nn.functional as F from torch.utils.data import TensorDataset, DataLoader import numpy as np X = np.array([i for i in np.arange(1, 20)]).reshape(-1, 1) X = torch.tensor(X, dtype=torch.float32, requires_grad=True) y = np.array([2*i+1 for i in np.arange(1, 20)]).reshape(-1, 1) y = torch.tensor(y, dtype=torch.float32, requires_grad=True) print(X.shape, y.shape) class LR(torch.nn.Module): def __init__(self, n_features, n_hidden1, n_out): super(LR, self).__init__() self.linear = torch.nn.Linear(n_features, n_hidden1) self.predict = torch.nn.Linear(n_hidden1, n_out) def forward(self, x): x = F.relu(self.linear(x)) x = self.predict(x) return x model = LR(1, 10, 1) optimizer = torch.optim.SGD(model.parameters(), lr=0.01) loss_fn = torch.nn.MSELoss() def train(epochs=100): for e in range(epochs): pred = model(X) loss = loss_fn(pred, y) optimizer.zero_grad() loss.backward() optimizer.step() print(f"epoch: {e} and loss= {loss}")

1条回答

网友

1楼 · 发布于 2024-10-01 17:35:54

你的学习速度太快了。这个模型朝着正确的方向走了几步，但它不能降落在一个真正好的极小值上，从此以后就绕着它曲折前进。如果您尝试lr=0.001，您的性能会更好。这就是为什么在使用一阶优化器时，随着时间的推移衰减学习率通常是有用的。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章