#python #numpy #machine-learning #pytorch #autograd
Вопрос:
Код:
import numpy as np
predictors = np.array([[73,67,43],[91,88,64],[87,134,58],[102,43,37],[69,96,70]],dtype='float32')
outputs = np.array([[56,70],[81,101],[119,133],[22,37],[103,119]],dtype='float32')
inputs = torch.from_numpy(predictors)
targets = torch.from_numpy(outputs)
weights = torch.randn(2,3,requires_grad=True)
biases = torch.randn(2,requires_grad=True)
def loss_mse(x,y):
d = x-y
return torch.sum(d*d)/d.numel()
def model(w,b,x):
return x @ w.t() b
def train(x,y,w,b,lr,e):
w = torch.tensor(w,requires_grad=True)
b = torch.tensor(b,requires_grad=True)
for epoch in range(e):
preds = model(w,b,x)
loss = loss_mse(y,preds)
if epoch%5 == 0:
print("Loss at Epoch [{}/{}] is {}".format(epoch,e,loss))
#loss.requires_grad=True
loss.backward()
with torch.no_grad():
w = w - lr*w.grad
b = b - lr*b.grad
w.grad.zero_()
b.grad.zero_()
train(inputs,targets,weights,biases,1e-5,100)
Запуск этого процесса приводит к различным ошибкам. Однажды он выдал ошибку loss
размером 0. Затем в строке обновления появилась ошибка w = w-lr*w.grad
, из которой float нельзя вычесть из NoneType.
Ответ №1:
Во-первых, почему вы дважды переносите свои веса и смещения в качестве тензора?
weights = torch.randn(2,3,requires_grad=True)
biases = torch.randn(2,requires_grad=True)de here
затем внутри функции поезда, которую вы используете:
w = torch.tensor(w,requires_grad=True)
b = torch.tensor(b,requires_grad=True)
Во-вторых, в части обновления ваших весов измените его на:
with torch.no_grad():
w_new = w - lr*w.grad
b_new = b - lr*b.grad
w.copy_(w_new)
b.copy_(b_new)
w.grad.zero_()
b.grad.zero_()
вы можете проверить это обсуждение для более подробного объяснения:
https://discuss.pytorch.org/t/updatation-of-parameters-without-using-optimizer-step/34244/20
Комментарии:
1. Спасибо! На самом деле, пока я отлаживал, я снова завернул веса и смещения, просто чтобы проверить, не были ли они проблемой, и забыл удалить их перед публикацией здесь. В любом случае, это сработало. Большое спасибо.