Что я должен использовать между CMU Pocketsphinx и CMU Sphinx4 для получения субтитров из видеофайлов?

#video #cmusphinx #sphinx4 #pocketsphinx

#Видео #cmusphinx #sphinx4 #pocketsphinx

Вопрос:

В конечном итоге я хотел бы извлечь субтитры из видеофайлов.

Текущие видеофайлы расположены на физическом диске, поэтому они будут рассматриваться как обучающие / тестовые данные. Но представьте, что у меня запущено веб-приложение, куда я загружаю свежее видео, и мое веб-приложение должно во время загрузки извлекать субтитры и т. Д. Я хочу сделать это настолько точным, насколько может один из этих декодеров 🙂 Пожалуйста, сообщите.

Ответ №1:

Вам нужно использовать Kaldi

Благодаря внедрению современных алгоритмов распознавания речи (глубокие нейронные сети и поиск WFST) Kaldi намного точнее (> 50%) и намного быстрее. Ни один из них не реализован в sphinx4 или pocketsphinx.

Комментарии:

1. Вау, я плохо знаком с архитектурой Sphinx, но я понял, что акустические модели основаны на скрытых моделях Макарова. Спасибо, я посмотрю на Kaldi, но тогда мой очевидный вопрос — какова конкуренция CMU Sphinx? Но я думаю, я должен задать еще один вопрос по «Sphinx vs Kaldi». Еще раз спасибо

2. Вы можете задать такой вопрос, но не в stackoverflow. Вопросы о рекомендации или поиске инструмента здесь не приветствуются.