Пользовательский шаблон Tesseract не применяется

Я хочу использовать OCR для этого изображения.введите здесь описание изображения Это заранее заданный формат. т.е. первые пять будут символами, затем следующие четыре будут цифрами и последние будут символами.

Когда я выполняю следующую команду

$ tesseract in.png stdout

Я получаю вывод как BDVPD474SQ

Итак, я выбрал пользовательский шаблон. Я создал файл (в каталоге /usr/share/tesseract-ocr/tessdata/configs) с именем bazaar (его содержимое следующее)

load_system_dawg     F
load_freq_dawg       F
user_patterns_suffix user-patterns

Я также создал файл с именем eng.user-patterns в каталоге /usr/share/tesseract-ocr/tessdata (его содержимое выглядит следующим образом)

\A\A\A\A\A\d\d\d\d\A

Тем не менее, я получаю тот же результат

$ tesseract in.png stdout bazaar
BDVPD474SQ

Что я делаю неправильно? Кто-нибудь сделал это с помощью Tess4j?


person Bhushan    schedule 30.10.2015    source источник
comment
Пришлось удалить свой пост, так как он был явно неверным. Я посмотрел источник ( code.google.com/ p/tesseract-ocr/source/browse/dict/trie.h ), что подтверждает правильность вашего шаблона. Также я попробовал ваш пример и получил тот же результат.   -  person Jo Oko    schedule 05.11.2015
comment
@JoOko Итак, можем ли мы сказать, что эта функция не реализована?   -  person Bhushan    schedule 05.11.2015
comment
И все еще, кажется, дело все эти годы спустя? :\   -  person jtlz2    schedule 12.09.2019