Критерий остановки перевода новостей Sockeye WMT с немецкого на английский

#machine-translation

#машинный перевод

Вопрос:

Я делаю учебник по адресу https://awslabs.github.io/sockeye/tutorials/wmt.html .

Следующая команда выдает результат, приведенный ниже.

 python3 -m sockeye.train -d train_data 
                        -vs newstest2016.tc.BPE.de 
                        -vt newstest2016.tc.BPE.en 
                        --max-seq-len 60 
                        --decode-and-evaluate 500 
                        --use-cpu 
                        -o wmt_model

sockeye.utils.SockeyeError: Please specify at least one stopping criteria: --max-samples --max-updates --max-checkpoints --max-num-epochs --max-num-checkpoint-not-improved
  

Каков разумный критерий остановки для этой задачи?

Ответ №1:

Типичным критерием остановки является ранняя остановка, то есть обучение модели до тех пор, пока потери при проверке не улучшатся. В Sockey это так --max-num-checkpoint-not-improved . Более подробную информацию см. в документации Sockey.