Keras зависает при использовании регуляризатора в модели CNN

#tensorflow #keras #conv-neural-network #tf.keras

#tensorflow #keras #conv-нейронная сеть #tf.keras

Вопрос:

У меня была пользовательская реализация CNN в keras, работающая с серверной частью TensorFlow. Чтобы улучшить обобщаемость, я работал над добавлением регуляризации в модель CNN. Модель отлично работает без какой-либо регуляризации активности / ядра. В тот момент, когда я добавляю регуляризацию активности / ядра, модель зависает между ними; обучение обычно останавливается между партиями / итерациями одной эпохи (например, для партии 67/172). Проблема очень повторяема и воспроизводима в моей системе, и я смог локализовать проблему до реализации регуляризации. Было странно видеть такое поведение, и я не мог найти похожие проблемы у других. Я не уверен, нужно ли мне предоставлять какую-либо дополнительную информацию, если кто-то может подсказать мне, чего не хватает, я был бы более чем счастлив предоставить необходимую информацию, и руководство по этому вопросу будет с благодарностью.

Ниже приведена некоторая полезная информация о таких вещах, как библиотеки / зависимости

  1. Keras 2.4.3
  2. Tensorflow 2.3.1
  3. Графический процессор: NVIDIA 1070 TI (8 ГБ)
  4. cudart64_101.dll был успешно открыт .
  5. Код был написан на Spyder, работающем на Python 3.8
  6. Ввод: 32 размер пакета, размер ввода (32, 256,64,1)
  7. Использование модели.функция подгонки для обучения модели
  8. 100 277 параметров, 99523 обучаемых

Ответ №1:

На самом деле, я думаю, что эта проблема устранена после того, как я обновил программное обеспечение NVIDIA до последней версии (11.1) и добавил самые последние в path