Архитектура распознавания webkitspeech

#webspeech-api #webkitspeechrecognition

#webspeech-api #Распознавание webkitspeech

Вопрос:

Я знаю, что webkitSpeechRecognition доступен только в браузере Chromium. Однако мне интересно, как он преобразует голос в текст?

Я попытался отслеживать сетевой журнал из консоли разработчика в Google Chrome и не вижу никакой сетевой активности. Я думал, что отправлю запрос API в Google, но я действительно этого не делаю.

Я также не могу найти ни одного архитектурного документа по этому вопросу.

У кого-нибудь есть идеи?

Комментарии:

1. посмотрев сетевой трафик на Telerik Fiddler, я вижу, что он взаимодействует с Google API. Однако он возвращается с неверным запросом!

Ответ №1:

насколько мне известно, нет официальной документации для API Google Speech, который используется в Chromium, но он был «перепроектирован» путем проверки исходного кода Chromium

при поиске вы должны найти несколько блогов / руководств, в которых описывается, как можно использовать REST API

хорошее описание того, как его использовать, можно найти здесь

http://blog.travispayton.com/wp-content/uploads/2014/03/Google-Speech-API.pdf

(что касается описания в PDF: упомянутый «Speech API V1» к настоящему времени отключен, поэтому можно использовать только «Полнодуплексный API»)

Но обратите внимание, что вам нужен ключ API через консоль разработчика Google (для Speech API ); и для этого вы должны быть зарегистрированы в группе разработчиков Chromium. Кроме того, используя ваш собственный ключ, на данный момент Speech API ограничен 50 транзакциями в день.