#tensorflow #keras #conv-neural-network #tf.keras
#tensorflow #keras #conv-нейронная сеть #tf.keras
Вопрос:
У меня была пользовательская реализация CNN в keras, работающая с серверной частью TensorFlow. Чтобы улучшить обобщаемость, я работал над добавлением регуляризации в модель CNN. Модель отлично работает без какой-либо регуляризации активности / ядра. В тот момент, когда я добавляю регуляризацию активности / ядра, модель зависает между ними; обучение обычно останавливается между партиями / итерациями одной эпохи (например, для партии 67/172). Проблема очень повторяема и воспроизводима в моей системе, и я смог локализовать проблему до реализации регуляризации. Было странно видеть такое поведение, и я не мог найти похожие проблемы у других. Я не уверен, нужно ли мне предоставлять какую-либо дополнительную информацию, если кто-то может подсказать мне, чего не хватает, я был бы более чем счастлив предоставить необходимую информацию, и руководство по этому вопросу будет с благодарностью.
Ниже приведена некоторая полезная информация о таких вещах, как библиотеки / зависимости
- Keras 2.4.3
- Tensorflow 2.3.1
- Графический процессор: NVIDIA 1070 TI (8 ГБ)
- cudart64_101.dll был успешно открыт .
- Код был написан на Spyder, работающем на Python 3.8
- Ввод: 32 размер пакета, размер ввода (32, 256,64,1)
- Использование модели.функция подгонки для обучения модели
- 100 277 параметров, 99523 обучаемых
Ответ №1:
На самом деле, я думаю, что эта проблема устранена после того, как я обновил программное обеспечение NVIDIA до последней версии (11.1) и добавил самые последние в path