Процесс тензорного потока убит

#tensorflow #keras

Вопрос:

EDIT1: Это результат dmesg после завершения процесса.

 [12011.054140] Out of memory: Killed process 472061 (python3) total-vm:98626268kB, anon-rss:22003964kB, file-rss:62584kB, shmem-rss:14336kB, UID:1000 pgtables:173776kB oom_score_adj:0
[12011.941128] oom_reaper: reaped process 472061 (python3), now anon-rss:0kB, file-rss:74732kB, shmem-rss:14336kB
 

Мне нужно обучить 5 моделей по 10 раз, используя tensorflow и keras для домашней работы. 2 из моделей являются многослойными моделями персептронов, а остальные 3 из них являются моделями CNN. Я тренируюсь с использованием своего графического процессора GTX1660Ti. У меня нет проблем с обучением моделей MLP, но когда я пытаюсь обучить модели CNN, я получаю ошибку ниже:

введите описание изображения здесь

Я добавил эти две строки кода, чтобы решить эту проблему:

 physical_devices = tf.config.list_physical_devices('GPU')
tf.config.experimental.set_memory_growth(physical_devices[0], True)
 

Однако, когда я пытаюсь обучить все модели в одном сценарии, мой процесс завершается после успешного обучения 3 моделей:

введите описание изображения здесь

Набор обучающих данных содержит 27000 изображений, набор тестовых данных содержит 5000 изображений, а набор проверочных данных содержит 3000 изображений каждое 28*28. Я подозреваю, что проблема в памяти gpu, но я не знаю подробностей. Любая помощь будет признательна.

Комментарии:

1. Дает ли он какие — либо предупреждения перед завершением процесса? (как будто кончается память)

2. @Пугает, к сожалению, нет. Это убивает его, как на последнем скриншоте. Ничего раньше.