Могу ли я классифицировать ivectors с помощью нейронных сетей для распознавания языка?

#neural-network #deep-learning #artificial-intelligence #speech-recognition #voice-recognition

#нейронная сеть #глубокое обучение #искусственный интеллект #распознавание речи #распознавание голоса

Вопрос:

Я создаю распознаватель языков, я планировал классифицировать свои i-векторы с помощью нейронных сетей, но я прочитал много статей, и они всегда используют другие методы, такие как SVM или PLDA, может кто-нибудь объяснить мне, почему? или это нормально делать с помощью нейронных сетей?

Ответ №1:

Нейронные сети хороши для сложного нелинейного ввода с несколькими параметрами. I-vectors по дизайну отображают пространство динамиков в очень простое пространство, где динамики легко разделяются с помощью логистической регрессии или SVM.

Если вы хотите попробовать с нейронными сетями, попробуйте что-нибудь сквозное, напримерhttps://github.com/FlashTek/vggvox-pytorch