Keras зависает при использовании регуляризатора в модели CNN

#tensorflow #keras #conv-neural-network #tf.keras

#tensorflow #keras #conv-нейронная сеть #tf.keras

Вопрос:

У меня была пользовательская реализация CNN в keras, работающая с серверной частью TensorFlow. Чтобы улучшить обобщаемость, я работал над добавлением регуляризации в модель CNN. Модель отлично работает без какой-либо регуляризации активности / ядра. В тот момент, когда я добавляю регуляризацию активности / ядра, модель зависает между ними; обучение обычно останавливается между партиями / итерациями одной эпохи (например, для партии 67/172). Проблема очень повторяема и воспроизводима в моей системе, и я смог локализовать проблему до реализации регуляризации. Было странно видеть такое поведение, и я не мог найти похожие проблемы у других. Я не уверен, нужно ли мне предоставлять какую-либо дополнительную информацию, если кто-то может подсказать мне, чего не хватает, я был бы более чем счастлив предоставить необходимую информацию, и руководство по этому вопросу будет с благодарностью.

Ниже приведена некоторая полезная информация о таких вещах, как библиотеки / зависимости

Keras 2.4.3
Tensorflow 2.3.1
Графический процессор: NVIDIA 1070 TI (8 ГБ)
cudart64_101.dll был успешно открыт .
Код был написан на Spyder, работающем на Python 3.8
Ввод: 32 размер пакета, размер ввода (32, 256,64,1)
Использование модели.функция подгонки для обучения модели
100 277 параметров, 99523 обучаемых

Ответ №1:

На самом деле, я думаю, что эта проблема устранена после того, как я обновил программное обеспечение NVIDIA до последней версии (11.1) и добавил самые последние в path

Вопрос:

Ответ №1:

Вам также может понравиться

Как я могу отредактировать свой config.php файл из HTML-формы

Python устанавливает переменную класса после вызова

как установить фоновое изображение на панель в Bada 2.0