#tensorflow #keras #lstm
Вопрос:
Я работаю над моделью генерации символов LSTM с использованием Keras. У меня есть несколько вопросов о том, как сформулировать модель. Мои данные выглядят так :
X_train = [[x1,x2,x3],[x4,x5,x6]]
Y_train = [[x4,x5,x6], [x7,x8,x9]]
У меня также есть X_test и Y_test.
Это структурировано так, что выходное значение, которое я пытаюсь предсказать, является следующей последовательностью.
Структура модели такова:
model = Sequential()
#Add Input Embedding Layer
model.add(Embedding(embed_size, embed_size, input_length=len(sequence))
model.add(LSTM(256))
model.add(Dropout(0.1))
# Add Output Layer
model.add(Dense(Y_train.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'])
У меня есть пара вопросов :
- Я видел много примеров, когда Y_train преобразуется в категориальные значения. Это необходимо?
- Для значений в наборе тестов я хочу вычислить перекрестную потерю энтропии для каждого значения в X_test. Как я могу это сделать в Керасе?