#tensorflow
Вопрос:
Поэтому я пытаюсь хранить веса в виде набора массивов numpy из BiLSTM, который я только что обучил. По реализации ядро LSTM имеет размер (E, (4 X H))
, где E
размер встраивания входной последовательности и H
размер скрытого измерения.
Сценарий обучения, который я использую, написан предыдущим парнем, который работал над этим проектом, поэтому я придерживаюсь этой структуры. Однако (batch_size, seq_len, 312)
E = 312
в данном случае размер ввода находится там, где, но размер ядра , который я получил из этой ячейки, составляет (440, (4 x H))
128, где разница между 312 и 440. Я в замешательстве, может кто-нибудь объяснить?
Комментарии:
1. Пожалуйста, проясните вашу конкретную проблему или предоставьте дополнительные сведения, чтобы точно указать, что вам нужно. Поскольку это написано в настоящее время, трудно точно сказать, о чем вы просите.