Как решить проблему градиентного взрыва/потерь в пользовательской функции потерь в PyTorch?

#optimization #deep-learning #pytorch #autograd Вопрос: Я написал пользовательскую функцию потерь в соответствии с указаниями этой статьи: https://epubs.siam.org/doi/pdf/10.1137/1.9781611976236.18 Однако, когда я пытаюсь обучить модель с помощью этой функции потерь, все выходные…

Продолжить чтениеКак решить проблему градиентного взрыва/потерь в пользовательской функции потерь в PyTorch?

Как решить проблему градиентного взрыва в YOLO v1

#python #pytorch #object-detection #nan #yolo Вопрос: Сейчас я пытаюсь обучить обнаружению объектов - YOLOv1, используя этот код. В начале я использовал momentum и weight_decay , но потеря тренировок после пары…

Продолжить чтениеКак решить проблему градиентного взрыва в YOLO v1