#google-speech-api #google-cloud-speech
#google-speech-api #google-cloud-speech
Вопрос:
Я использую Google Speech API, у моей целевой аудитории британский акцент, но я получаю хорошие результаты, когда использую код языка en-US. Команда, для которой мы преобразуем речь в текст, использует множество сокращений, которые не отображаются в ответе. Я попытался указать сокращения в speech_context, но все еще безуспешно. Кто-нибудь может помочь мне с пользовательскими словами / сокращениями. Я также пробовал передавать фразу вместо сокращения в speech_context, но, похоже, ничего не работает. Я использую улучшенную модель видео. Я даже использовал $OOV_CLASS_ALPHANUMERIC_SEQUENCE в speech_context, но результат становится хуже.
Ниже приведена моя конфигурация
config = {
"language_code": "en-US",
"sample_rate_hertz": 48000,
"encoding": enums.RecognitionConfig.AudioEncoding.FLAC,
"model":"video",
"use_enhanced":True,
"enable_automatic_punctuation":True,
"profanity_filter": True,
"max_alternatives":2,
"speech_contexts":[{"phrases":["MTU"]}]
}
Расшифровка: TSU отключил TSU для сброса. Хорошо, очистите 10 — 2 T
XC y — 0 возвращает поверхностьОжидаемая расшифровка: TSU отключился при сбросе TSU4, MTU 10-2 и TNC 118-0 вернулись в эксплуатацию