Преобразование речи в текст в веб-приложении dot net core 3.1 без использования облачных сервисов, таких как Azure

#asp.net-core #speech-to-text #pocketsphinx #kaldi #mozilla-deepspeech

#asp.net-core #преобразование речи в текст #pocketsphinx #kaldi #mozilla-deepspeech

Вопрос:

Я пытаюсь реализовать преобразование речи в текст в моем веб-приложении .net core 3.1 без использования каких-либо облачных сервисов, таких как Azure, AWS или Google.

Я нашел такие варианты, как deepspeech, kaldi, pocketpheonix. Похоже, что они могут быть реализованы в приложении .net core, но, будучи новичком в .net core и серверной разработке, я не знаю, как их использовать, и их документация не очень удобна для начинающих.

Поэтому, если вы можете предоставить краткий обзор того, как реализовать эти API в .net core, или ссылку на некоторые статьи, это было бы очень полезно.

Комментарии:

1. I am trying to implement speech to text on my .net core 3.1 web app Вы хотели бы распознавать речь с помощью микрофона устройства пользователя браузера на клиенте JavaScript?

2. @FeiHan Я пробовал webspeech api, но он поддерживается только Chrome. Знаете ли вы о каких-либо других решениях, поддерживаемых большим количеством браузеров?

3. Взгляните на github.com/mozilla/DeepSpeech/tree/v0.9.3/native_client/dotnet и deepspeech.readthedocs.io/en/latest /.

4. @Abid webspeech API в Chrome использует для этого облачные сервисы Google.

Ответ №1:

Просто мое личное мнение, у некоторых экспертов Kaldi или PocketSphinx может быть другое мнение.

Kaldi PocketSphinx

Вам нужно будет самостоятельно скомпилировать все исходные тексты в Windows, а Kaldi — это головная боль при сборке в Linux, так что я думаю, что в Windows это не намного лучше. Тем не менее, они используют меньше ресурсов и, как правило, быстрее.

DeepSpeech

Просто загрузите текущую английскую акустическую модель (pbmm) и языковую модель (scorer) и используйте пример кода .NET. Должно работать без компиляции.