Возможно ли, что количество параметров отличается, даже если модель нейронной сети имеет одинаковую структуру?

#python #tensorflow #neural-network #tf.keras

Вопрос:

Я пытаюсь создать 2 полностью подключенные модели DNN с одинаковой структурой, чтобы позже скопировать веса одной из них в другую.

Поскольку они имеют одинаковую структуру, мне не нужно создавать разные коды, поэтому я использовал один и тот же код для создания 2 объектов DNN.

Однако результаты были такими странными, потому что количество параметров было разным, хотя я использую один и тот же код и одни и те же гиперпараметры!

Например, я установил такое же количество нейронов, как и другие: Входной слой: 3 1-й Скрытый слой: 256 2-й Скрытый слой: 256 Выходной слой: 2

Тем не менее, резюме двух созданных моделей были следующими:

####### Модель 1 ##### Модель: «dnn»

Слой (тип) Параметр Выходной Формы #

input_1 (Слой ввода) [(Нет, 3)] 0
плотный (плотный) кратный 1024
плотность 1 (плотная) кратна 65792 плотность
2 (плотная) кратна 514

Всего параметров: 67 330 Обучаемых параметров: 67 330 Необучаемых параметров: 0


####### Модель 2 ##### Модель: «dnn_1»

Слой (тип) Параметр выходной формы #
input_2 (Слой ввода) [(Нет, 3)] 0
dense_3 (Плотный) кратный 768
плотность 4 (плотная) кратна 65792 плотность
5 (плотная) кратна 514

Общее количество параметров: 67 074 Обучаемых параметров: 67 074 Необучаемых параметров: 0


Я несколько раз проверял свой код, но я просто использовал одни и те же гиперпараметры для 2 объектов DNN.

Как может dense и dense_3 иметь разное количество параметров?

Не могли бы вы дать мне несколько советов по этому поводу?

Комментарии:

1. Можете ли вы поделиться полным кодом для репликации своей проблемы? чтобы мы могли попытаться помочь вам. Спасибо!