#c# #speech-recognition #voice-recognition #speech-to-text
#c# #распознавание речи #распознавание голоса #преобразование речи в текст
Вопрос:
Существуют ли какие-либо алгоритмы или библиотеки для C #, которые можно использовать для оценки произношения пользователя?
Например, что-то вроде расстояния Левенштейна для текста, но для речи.
Любые связанные ссылки или информация об алгоритмах были бы полезны. Я пишу приложение, которому нужно что-то вроде распознавания речи, поэтому было бы здорово, если бы были соответствующие библиотеки C #.
Конечно, было бы также здорово, если бы библиотека могла преобразовывать речь в текст, желательно на многих языках.
Ответ №1:
Вы можете узнать больше об алгоритмах произношения из статей
Метод измерения разборчивости и непривычности качества телефона при обучении произношению на иностранном языке Го Каваи и Кейкичи Хиросе
http://www.shlrc.mq.edu.au/proceedings/icslp98/PDF/AUTHOR/SL980782.PDF
Система SRI EduSpeakTM: оценка распознавания и произношения Франко и др.
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.6.7417amp;rep=rep1amp;type=pdf
Я не думаю, что для этого существует какая-либо библиотека C #, но вы можете использовать существующий инструментарий распознавания речи через обертки (библиотека C) или с IKVM (библиотека Java). Вы можете узнать больше о CMUSphinx speech recognition took из руководства
http://cmusphinx.sourceforge.net/wiki/tutorial
В качестве примера реализации оценки произношения проверьте веб-сайт Ottercall: