#asp.net-core #speech-to-text #pocketsphinx #kaldi #mozilla-deepspeech
#asp.net-core #преобразование речи в текст #pocketsphinx #kaldi #mozilla-deepspeech
Вопрос:
Я пытаюсь реализовать преобразование речи в текст в моем веб-приложении .net core 3.1 без использования каких-либо облачных сервисов, таких как Azure, AWS или Google.
Я нашел такие варианты, как deepspeech, kaldi, pocketpheonix. Похоже, что они могут быть реализованы в приложении .net core, но, будучи новичком в .net core и серверной разработке, я не знаю, как их использовать, и их документация не очень удобна для начинающих.
Поэтому, если вы можете предоставить краткий обзор того, как реализовать эти API в .net core, или ссылку на некоторые статьи, это было бы очень полезно.
Комментарии:
1.
I am trying to implement speech to text on my .net core 3.1 web app
Вы хотели бы распознавать речь с помощью микрофона устройства пользователя браузера на клиенте JavaScript?2. @FeiHan Я пробовал webspeech api, но он поддерживается только Chrome. Знаете ли вы о каких-либо других решениях, поддерживаемых большим количеством браузеров?
3. Взгляните на github.com/mozilla/DeepSpeech/tree/v0.9.3/native_client/dotnet и deepspeech.readthedocs.io/en/latest /. …
4. @Abid webspeech API в Chrome использует для этого облачные сервисы Google.
Ответ №1:
Просто мое личное мнение, у некоторых экспертов Kaldi или PocketSphinx может быть другое мнение.
Kaldi PocketSphinx
Вам нужно будет самостоятельно скомпилировать все исходные тексты в Windows, а Kaldi — это головная боль при сборке в Linux, так что я думаю, что в Windows это не намного лучше. Тем не менее, они используют меньше ресурсов и, как правило, быстрее.
DeepSpeech
Просто загрузите текущую английскую акустическую модель (pbmm) и языковую модель (scorer) и используйте пример кода .NET. Должно работать без компиляции.