Един приятел и аз се интересуваме от обучението на tesseract-OCR двигателя за CV проект. Опитахме да използваме някои обвивки като PyTesser и pyocr, но резултатите в момента не са толкова точни, колкото ни трябва. Поради това искаме да опитаме да обучим тесеракта да работи по-добре за нашите цели (т.е. идентифициране на текст върху етикетите на храни), но имаме проблеми с инсталирането на инструментите за обучение.
Какво опитахме:
Разглеждайки уебсайта на google code, страницата „Компилиране“ в wiki на google code на tesseract казва, инструментите за обучение са налични само във версия 3.03. Въпреки това страницата „Изтегляния“ на кода на Google за tesseract-ocr съдържа само материалите за 3.02. В долната част на страницата „Компилиране“ също има някои коментари относно инсталирането на версия 3.03 на Windows и OSX, но все още няма коментари за потребителите на Linux.
Изглежда също, че има някакъв пакет с изходен код 3.03 за Ubuntu, но не сме сигурни как да получим достъп до него на нашите компютри и страницата „Компилиране“ казва, че трябва да изпълним тези команди:
make training
sudo make training-install
Също така намерихме групова нишка в Google за tesseract 3.03, но отново изглежда така публикациите не включват съвети за потребители на Linux (освен ако не сме пропуснали нещо по време на първоначалното четене).
Това наистина ли е наистина прост проблем при инсталиране от командния ред? Или има ли начин тесеракт да се обучи с 3.02 (който в момента имаме инсталиран)? Дали не сме търсили информация на грешните места?
Всички съвети или връзки към инструкции за инсталиране на tesseract-ocr 3.03 за дистрибуции на Linux ще бъдат много оценени! Благодаря.