Прогнозирование танцевальных кадров с помощью Pytorch

#machine-learning #pytorch #lstm #autoencoder

#машинное обучение #pytorch #lstm #автоэнкодер

Вопрос:

Я создал архитектуру VAE для кодирования танцевальных кадров в скрытые представления.

Затем я планировал использовать LSTM, чтобы взять последовательность этих скрытых векторов для прогнозирования следующего. Затем декодируйте его и, таким образом, сгенерируйте новую танцевальную последовательность.

Однако это не работает. Прогнозирование LSTMs немного отклонено, что делает прогнозируемый кадр не совсем точным. Поскольку этот неточный кадр используется в качестве входных данных для следующего LSTM, прогнозирование LSTM становится еще хуже, пока прогнозы не станут просто черными.

Есть ли у кого-нибудь опыт кодированного последовательного прогнозирования данных, который знает, как решить проблему? Или, может быть, можно предложить другую архитектуру, которая может работать для прогнозирования танцевальных кадров?

Комментарии:

1. Вам следует взглянуть на запланированную выборку, которая может помочь вам уменьшить эти неточности arxiv.org/abs/1506.03099