Мути-потеря не может быть

ProgramBox

Мути-потеря не может быть

Post author:admin
Запись опубликована:26 января, 2022
Post category:Вопросы по программированию

#deep-learning #bert-language-model

Вопрос:

Я строю модель на основе Берта. И я хочу использовать две задачи для обучения модели, которая состоит из Mask Language Modeling и Classsification .

Для этих двух задач я наблюдаю изменение потерь в период обучения. И я нахожу MLM loss , что, кажется, не уменьшается, в то время clf loss как уменьшается.

Что я должен сделать MLM loss , чтобы уменьшить?

Мое learning rate это 1e-5

Метки: Мути-потеря не может быть

Вопрос:

Вам также может понравиться

Ошибка 505 при попытке просмотреть изображение

JavaFX и версии netbeans и java 8

передача asynch завершается сбоем в AWS/s3 при работе синхронизации передачи