Распознавание речи в vb6

#vb6 #speech-recognition

#vb6 #распознавание речи

Вопрос:

Кто-нибудь знает, как закодировать распознавание речи, чтобы распознавание речи Microsoft обнаруживало заданное слово …. любые ссылки, в которые я поместил весь код, который может выполнять распознавание, но знаю, как закодировать распознавание речи Microsoft, обнаружит заданное слово….

Мое кодирование:

 Option Explicit
Dim rs As New ADODB.Recordset
Dim recognizer As SpInprocRecognizer
Dim MyGrammer As ISpeechRecoGrammar
Dim grammar As ISpeechRecoGrammar
Dim InputFile As SpeechLib.SpFileStream
Private Sub Form_Load()

Set RC = New SpInProcRecoContext
Set recognizer = RC.recognizer
Set myGrammar = RC.CreateGrammar
myGrammar.DictationSetState SGDSActive

Dim Category As SpObjectTokenCategory
Set Category = New SpObjectTokenCategory
Category.SetId SpeechCategoryAudioIn

Dim Token As SpObjectToken
Set Token = New SpObjectToken
Token.SetId Category.Default()
Set recognizer.AudioInput = Token

Out 888, 0

End Sub
  

Ответ №1:

До того, как SSR M.S. и releated company создали TTS — Преобразование текста в речь, базовым движком для TTS была foenemmology — фонемы для громкоговорителей и фонемы для распознавания речи через микрофон. Как это похоже на то, что P.C. произносит слова, за исключением того, что человек произносит слова в микрофон, но у многих слов одинаковое произношение и разное написание в предложении. С другой стороны, движок SSR, за исключением темпа, произношения — (например: Чистый-североамериканский -говорите по-английски с низким акцентом (не громко, просто четко говорите) ), средний — среднее значение мощности ваших произносимых слов в микрофон по сравнению с громкими и некоторое время на подготовку движка SSR для сбора информации об этом в собственной системе данных. SSR использует работу TTS и собственного движка для конкретного языка для создания распознавания речи.

Ответ №2:

Ваш ответ находится на этой веб-странице http://www.martin2k.co.uk/vb6/tips/vb_10.php

Комментарии:

1. Предоставленная вами ссылка равна 404

Ответ №3:

Просто для ясности, существует два типа распознавания речи : диктовка и командование и контроль. В режиме диктовки вы прослушиваете каждое возможное слово и пытаетесь найти соответствие. Это хорошо для систем типа диктовки, где человек говорит, и вы хотите все расшифровать. Хорошим примером грамматики диктовки является преобразование голосовой почты в текст. Команды и управление используют ограниченную грамматику, что повышает точность. Если под «заданным словом» вы подразумеваете заданное количество слов, то команды и управление — это то, что вам нужно. Примером может служить система IVR, в которой вы воспроизводите приглашение и ждете ответа: «Пожалуйста, нажмите 1 для продаж и 2 для поддержки». Грамматика будет содержать только «1 или 2». Слово one могло бы звучать как множество разных слов, если бы мы просматривали весь языковой словарь, но сравнить разницу только между словами 1 и 2 несложно. Вот один пример, который поможет любому, кто изучает распознавание речи:

http://msdn.microsoft.com/en-us/library/ms720589 (v = против 85).aspx

Вы можете увидеть, как загрузить грамматику из файла и как структурировать XML-файл, содержащий вашу грамматику.