Пользовательский шаблон Tesseract не применяется

Я хочу использовать OCR для этого изображения. Это заранее заданный формат. т.е. первые пять будут символами, затем следующие четыре будут цифрами и последние будут символами.

Когда я выполняю следующую команду

$ tesseract in.png stdout

Я получаю вывод как BDVPD474SQ

Итак, я выбрал пользовательский шаблон. Я создал файл (в каталоге /usr/share/tesseract-ocr/tessdata/configs) с именем bazaar (его содержимое следующее)

load_system_dawg     F
load_freq_dawg       F
user_patterns_suffix user-patterns

Я также создал файл с именем eng.user-patterns в каталоге /usr/share/tesseract-ocr/tessdata (его содержимое выглядит следующим образом)

\A\A\A\A\A\d\d\d\d\A

Тем не менее, я получаю тот же результат

$ tesseract in.png stdout bazaar
BDVPD474SQ

Что я делаю неправильно? Кто-нибудь сделал это с помощью Tess4j?

ocr tesseract tess4j

Bhushan 30.10.2015 источник

comment

Пришлось удалить свой пост, так как он был явно неверным. Я посмотрел источник ( code.google.com/ p/tesseract-ocr/source/browse/dict/trie.h ), что подтверждает правильность вашего шаблона. Также я попробовал ваш пример и получил тот же результат. - Jo Oko 05.11.2015

comment

@JoOko Итак, можем ли мы сказать, что эта функция не реализована? - Bhushan 05.11.2015

comment

И все еще, кажется, дело все эти годы спустя? :\ - jtlz2 12.09.2019

Пользовательский шаблон Tesseract не применяется

Похожие вопросы