#neural-network #deep-learning #artificial-intelligence #speech-recognition #voice-recognition
#нейронная сеть #глубокое обучение #искусственный интеллект #распознавание речи #распознавание голоса
Вопрос:
Я создаю распознаватель языков, я планировал классифицировать свои i-векторы с помощью нейронных сетей, но я прочитал много статей, и они всегда используют другие методы, такие как SVM или PLDA, может кто-нибудь объяснить мне, почему? или это нормально делать с помощью нейронных сетей?
Ответ №1:
Нейронные сети хороши для сложного нелинейного ввода с несколькими параметрами. I-vectors по дизайну отображают пространство динамиков в очень простое пространство, где динамики легко разделяются с помощью логистической регрессии или SVM.
Если вы хотите попробовать с нейронными сетями, попробуйте что-нибудь сквозное, напримерhttps://github.com/FlashTek/vggvox-pytorch