Как расшифровать аудиоклип продолжительностью более 1 минуты в cloud speech to text API?

#android #google-cloud-platform #google-cloud-speech

#Android #google-облачная платформа #google-cloud-speech

Вопрос:

Моя проблема в том, что я пытался расшифровать аудиоклип продолжительностью менее одной минуты с помощью Google Cloud и его работы, но когда я попробовал больше минуты, это не сработало. Итак, мой вопрос в том, как расшифровать аудио продолжительностью более минуты или без ограничений?

Ответ №1:

Из https://cloud.google.com/speech-to-text/quotas#content:

  • Аудио длиной более ~ 1 минуты должно использовать поле uri для ссылки на аудиофайл в облачном хранилище Google.

Итак, сохраните файл в хранилище Google перед расшифровкой.

Комментарии:

1. Можем ли мы не делать этого для локальных файлов? Должен быть какой-то способ

2. Я в это не верю, вместо этого загрузите, а затем расшифруйте.

Ответ №2:

Транскрибирование короткого аудиофайла с использованием синхронного распознавания речи Транскрибирование короткого аудиофайла. Если ваш аудиофайл длится более 1 минуты, вы используете асинхронное распознавание речи.

Рассмотрим этот пример, взятый из этой документации для транскрибирования длинного аудиофайла. Вы можете запустить пример команды ниже в облачной оболочке. Вам просто нужно загрузить (как загружать объекты в GCS) ваш аудиофайл в GCS, а затем использовать его в качестве входных данных.

 gcloud ml speech recognize-long-running 
'gs://gcs-test-data/vr.flac' 
 --language-code='en-US' --async

gcloud ml speech operations describe [OPERATION_ID]
  

Комментарии:

1. Пожалуйста, имейте в виду цены от 0 до 60 минут (в месяц) бесплатно, за все, что превышает, взимается соответствующая плата cloud.google.com/speech-to-text/pricing