Что мне следует использовать между CMU Pocketsphinx и CMU Sphinx4, чтобы получить субтитры из видеофайлов?

В конце концов я хотел бы извлечь субтитры из видеофайлов.

Текущие видеофайлы находятся на физическом диске, поэтому они будут рассматриваться как обучающие/тестовые данные. Но представьте, что у меня запущено веб-приложение, в которое я загружаю свежее видео, и мое веб-приложение должно во время загрузки извлекать субтитры и т. д. Я хочу сделать его настолько точным, насколько это может сделать один из этих декодеров :) Пожалуйста, посоветуйте.


person Novitoll    schedule 18.10.2016    source источник


Ответы (1)


Вам нужно использовать Kaldi.

Благодаря внедрению современных алгоритмов распознавания речи (глубокие нейронные сети и поиск WFST) Kaldi работает намного точнее (> 50%) и намного быстрее. Ни один из них не реализован в sphinx4 или pocketsphinx.

person Nikolay Shmyrev    schedule 18.10.2016
comment
Вау, я плохо знаком с архитектурой Sphinx, но я понял, что акустические модели основаны на моделях Hidden Makarov. Спасибо, я посмотрю на Kaldi, но тогда у меня очевидный вопрос: в чем состоит конкуренция CMU Sphinx? Но я думаю, мне следует задать еще один вопрос о Sphinx vs Kaldi. Спасибо еще раз - person Novitoll; 18.10.2016
comment
Вы можете задать такой вопрос, но не на stackoverflow. Вопросы по рекомендации или поиску инструмента здесь не приветствуются. - person Nikolay Shmyrev; 18.10.2016