#video #cmusphinx #sphinx4 #pocketsphinx
#Видео #cmusphinx #sphinx4 #pocketsphinx
Вопрос:
В конечном итоге я хотел бы извлечь субтитры из видеофайлов.
Текущие видеофайлы расположены на физическом диске, поэтому они будут рассматриваться как обучающие / тестовые данные. Но представьте, что у меня запущено веб-приложение, куда я загружаю свежее видео, и мое веб-приложение должно во время загрузки извлекать субтитры и т. Д. Я хочу сделать это настолько точным, насколько может один из этих декодеров 🙂 Пожалуйста, сообщите.
Ответ №1:
Вам нужно использовать Kaldi
Благодаря внедрению современных алгоритмов распознавания речи (глубокие нейронные сети и поиск WFST) Kaldi намного точнее (> 50%) и намного быстрее. Ни один из них не реализован в sphinx4 или pocketsphinx.
Комментарии:
1. Вау, я плохо знаком с архитектурой Sphinx, но я понял, что акустические модели основаны на скрытых моделях Макарова. Спасибо, я посмотрю на Kaldi, но тогда мой очевидный вопрос — какова конкуренция CMU Sphinx? Но я думаю, я должен задать еще один вопрос по «Sphinx vs Kaldi». Еще раз спасибо
2. Вы можете задать такой вопрос, но не в stackoverflow. Вопросы о рекомендации или поиске инструмента здесь не приветствуются.