#python #tensorflow #neural-network #tf.keras
Вопрос:
Я пытаюсь создать 2 полностью подключенные модели DNN с одинаковой структурой, чтобы позже скопировать веса одной из них в другую.
Поскольку они имеют одинаковую структуру, мне не нужно создавать разные коды, поэтому я использовал один и тот же код для создания 2 объектов DNN.
Однако результаты были такими странными, потому что количество параметров было разным, хотя я использую один и тот же код и одни и те же гиперпараметры!
Например, я установил такое же количество нейронов, как и другие: Входной слой: 3 1-й Скрытый слой: 256 2-й Скрытый слой: 256 Выходной слой: 2
Тем не менее, резюме двух созданных моделей были следующими:
####### Модель 1 ##### Модель: «dnn»
Слой (тип) Параметр Выходной Формы #
input_1 (Слой ввода) [(Нет, 3)] 0
плотный (плотный) кратный 1024
плотность 1 (плотная) кратна 65792 плотность
2 (плотная) кратна 514
Всего параметров: 67 330 Обучаемых параметров: 67 330 Необучаемых параметров: 0
####### Модель 2 ##### Модель: «dnn_1»
Слой (тип) Параметр выходной формы #
input_2 (Слой ввода) [(Нет, 3)] 0
dense_3 (Плотный) кратный 768
плотность 4 (плотная) кратна 65792 плотность
5 (плотная) кратна 514
Общее количество параметров: 67 074 Обучаемых параметров: 67 074 Необучаемых параметров: 0
Я несколько раз проверял свой код, но я просто использовал одни и те же гиперпараметры для 2 объектов DNN.
Как может dense и dense_3 иметь разное количество параметров?
Не могли бы вы дать мне несколько советов по этому поводу?
Комментарии:
1. Можете ли вы поделиться полным кодом для репликации своей проблемы? чтобы мы могли попытаться помочь вам. Спасибо!