#google-api #google-speech-to-text-api
#google-api #google-speech-to-text-api
Вопрос:
В проекте мы используем преобразование речи в текст службы Google.
С одной стороны, это дает много преимуществ и упрощает обработку звука, с другой стороны, мы учитываем специальное форматирование данных, например:
Тип поля: Деньги
Current Output : no payment due
Expected Output : $0
Current Output : no outstanding balance
Expected Output : $0
Тип поля: Дата
Current Output : May 1st 2020
Expected Output : 05/01/2020
Current Output : May 1st 2020.
Expected Output : 05/01/2020
Current Output : June 1st 2020.
Expected Output : 06/01/2020
Current Output : March 13th.
Expected Output : 03/13/2020 (automatically infer the year)
Мы попытались рассмотреть class-token, но этот подход не предоставил инструмента для удовлетворения наших потребностей.
Мы несколько раз проверяли API, исследуя поведение — результат все тот же.
Я считаю, что мы что-то упустили и надеемся на помощь сообщества.
Постскриптум
Наш язык проекта java
, и мы считаем, что в масштабах проблемы это не так важно.