Sl4a распознает речь в фоновом режиме

#android #python #speech-recognition #sl4a #qpython

#Android #python #распознавание речи #sl4a #qpython

Вопрос:

Я начал программировать sl4a (в QPython), и это действительно здорово. Теперь я попытался использовать функцию droid.recognizeSpeech. Этот тоже работает нормально, но мне нравится, когда он прослушивает ключевое слово в фоновом режиме, например, «OK Google» от Google. Итак, я огляделся, но ничего не могу найти. Я не знаю, как я могу это реализовать. Итак, я спрашиваю вас, может ли кто-нибудь сказать мне, если это возможно, как заставить распознавать речь, всегда прослушиваемую в фоновом режиме в ожидании ключевого слова?

1. Вам нужно разложить эту задачу. Сначала попробуйте реализовать прослушиватель для ключевого слова с помощью PocketsphinxAndroid на Java. Во-вторых, реализовать требуемый для вызова java-код из sl4a. Вы можете запускать поиск по ключевым словам в службе и получать уведомления об обнаружении только с помощью сообщений о намерениях.

2. Хорошо, если я объединю java и sl4a. Но я ищу решение только для sl4a.

Ответ №1:

Я поиграл с идеей сделать это, но так и не нашел для этого никакого полезного практического применения. Итак, вот краткое изложение моих исследований, надеюсь, этого достаточно, чтобы вы начали: 1. Фасад распознавателя речи имеет несколько параметров. Обычно все ставят «нет» во всех из них, кроме первого. Вот фасад в его реальности:

Распознавание речи:
распознает речь пользователя и возвращает наиболее вероятный результат. текстовая подсказка (строка) для отображения пользователю при запросе их говорить (необязательно)
переопределение языка (строки) языка, чтобы сообщить распознавателю, что он должен ожидать речь на языке, отличном от того, который установлен в java.util.Locale.getDefault() (необязательно)

languageModel (строка) сообщает распознавателю, какую речевую модель предпочесть (см. android.speech.Распознавание (необязательно)
возвращает: (String) Пустую строку в случае, если речь не может быть распознана.

Итак, вы ищете languageModel в этом случае, эта опция ограничена двумя типами. Модель веб-поиска и модель речи в произвольной форме. В данном случае вы ищете модель речи в произвольной форме. Вот еще немного информации об этой модели из первых уст: Google о модели языка свободной формы

После того, как вы ознакомились с моделью речи в произвольной форме, вам должна помочь модель непрерывного распознавания речи Chrome, которая должна иметь много общих характеристик с моделью языка в произвольной форме. Надеюсь, это поможет вам выбрать правильное направление