Обучающая модель персонажа LSTM с использованием Keras

#tensorflow #keras #lstm

Вопрос:

Я работаю над моделью генерации символов LSTM с использованием Keras. У меня есть несколько вопросов о том, как сформулировать модель. Мои данные выглядят так :

 X_train = [[x1,x2,x3],[x4,x5,x6]]
Y_train =  [[x4,x5,x6], [x7,x8,x9]]
 

У меня также есть X_test и Y_test.

Это структурировано так, что выходное значение, которое я пытаюсь предсказать, является следующей последовательностью.

Структура модели такова:

 model = Sequential()
#Add Input Embedding Layer
model.add(Embedding(embed_size, embed_size, input_length=len(sequence))
model.add(LSTM(256))
model.add(Dropout(0.1))
# Add Output Layer
model.add(Dense(Y_train.shape[1], activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam',metrics=['accuracy'])  
 

У меня есть пара вопросов :

  1. Я видел много примеров, когда Y_train преобразуется в категориальные значения. Это необходимо?
  2. Для значений в наборе тестов я хочу вычислить перекрестную потерю энтропии для каждого значения в X_test. Как я могу это сделать в Керасе?