Ошибка при выполнении функции обратного хода() в PyTorch

#python #numpy #machine-learning #pytorch #autograd

Вопрос:

Код:

  import numpy as np
 predictors = np.array([[73,67,43],[91,88,64],[87,134,58],[102,43,37],[69,96,70]],dtype='float32')
 outputs = np.array([[56,70],[81,101],[119,133],[22,37],[103,119]],dtype='float32')
 

 inputs = torch.from_numpy(predictors)
 targets = torch.from_numpy(outputs)

 weights = torch.randn(2,3,requires_grad=True)
 biases = torch.randn(2,requires_grad=True)

 def loss_mse(x,y):
  d = x-y
  return torch.sum(d*d)/d.numel()

 def model(w,b,x):
  return x @ w.t()  b 
 
 def train(x,y,w,b,lr,e):
  w = torch.tensor(w,requires_grad=True)
  b = torch.tensor(b,requires_grad=True)
  for epoch in range(e):
    preds = model(w,b,x)
    loss = loss_mse(y,preds)
    if epoch%5 == 0:
      print("Loss at Epoch [{}/{}] is {}".format(epoch,e,loss))
    #loss.requires_grad=True
    loss.backward()
    with torch.no_grad():
      w = w - lr*w.grad
      b = b - lr*b.grad
      w.grad.zero_()
      b.grad.zero_()

 train(inputs,targets,weights,biases,1e-5,100)

Запуск этого процесса приводит к различным ошибкам. Однажды он выдал ошибку loss размером 0. Затем в строке обновления появилась ошибка w = w-lr*w.grad , из которой float нельзя вычесть из NoneType.

Ответ №1:

Во-первых, почему вы дважды переносите свои веса и смещения в качестве тензора?

 weights = torch.randn(2,3,requires_grad=True)
biases = torch.randn(2,requires_grad=True)de here

затем внутри функции поезда, которую вы используете:

 w = torch.tensor(w,requires_grad=True)
b = torch.tensor(b,requires_grad=True)

Во-вторых, в части обновления ваших весов измените его на:

   with torch.no_grad():
   w_new = w - lr*w.grad
   b_new = b - lr*b.grad
   w.copy_(w_new)
   b.copy_(b_new)
   w.grad.zero_()
   b.grad.zero_()

вы можете проверить это обсуждение для более подробного объяснения:
https://discuss.pytorch.org/t/updatation-of-parameters-without-using-optimizer-step/34244/20

1. Спасибо! На самом деле, пока я отлаживал, я снова завернул веса и смещения, просто чтобы проверить, не были ли они проблемой, и забыл удалить их перед публикацией здесь. В любом случае, это сработало. Большое спасибо.

Вопрос:

Ответ №1:

Комментарии:

Вам также может понравиться

Как я могу отправить и получить строку через nat, просто, как вы можете?

кроссбраузерный элемент onresize (HTML / JS)

Добавьте заголовок для операций с использованием данной службы в контракт OpenAPI