оценка произношения (правильность голоса)

#c# #speech-recognition #voice-recognition #speech-to-text

#c# #распознавание речи #распознавание голоса #преобразование речи в текст

Вопрос:

Существуют ли какие-либо алгоритмы или библиотеки для C #, которые можно использовать для оценки произношения пользователя?

Например, что-то вроде расстояния Левенштейна для текста, но для речи.

Любые связанные ссылки или информация об алгоритмах были бы полезны. Я пишу приложение, которому нужно что-то вроде распознавания речи, поэтому было бы здорово, если бы были соответствующие библиотеки C #.

Конечно, было бы также здорово, если бы библиотека могла преобразовывать речь в текст, желательно на многих языках.

Ответ №1:

Вы можете узнать больше об алгоритмах произношения из статей

Метод измерения разборчивости и непривычности качества телефона при обучении произношению на иностранном языке Го Каваи и Кейкичи Хиросе

http://www.shlrc.mq.edu.au/proceedings/icslp98/PDF/AUTHOR/SL980782.PDF

Система SRI EduSpeakTM: оценка распознавания и произношения Франко и др.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.6.7417amp;rep=rep1amp;type=pdf

Я не думаю, что для этого существует какая-либо библиотека C #, но вы можете использовать существующий инструментарий распознавания речи через обертки (библиотека C) или с IKVM (библиотека Java). Вы можете узнать больше о CMUSphinx speech recognition took из руководства

http://cmusphinx.sourceforge.net/wiki/tutorial

В качестве примера реализации оценки произношения проверьте веб-сайт Ottercall:

http://ottercall.com/