Идентификатор чтения Tesseract OCR для Android

Я пытаюсь реализовать tesseract (tess-two) для чтения данных одного идентификатора или проверки. Мог ли кто-то это сделать? У меня проблемы с распознаванием текста. Результат имеет много лишних символов


person init-ec    schedule 28.03.2014    source источник


Ответы (1)


По своему опыту работы с Tesseract OCR я обнаружил, что получаю гораздо лучшие результаты, если преобразовываю изображение в двоичный байт (пиксели либо черные, либо белые). Механизмы OCR, как правило, работают лучше при высокой контрастности. Информацию о том, как преобразовать растровые изображения Android в двоичные изображения, см. в этом вопросе (Android : преобразование оттенков серого в двоичное изображение).

По этой ссылке объясняется, почему черно-белые изображения работают лучше, а также рассказывается о других способах повышения точности оптического распознавания символов (https://marinersoftware.deskpro.com/kb/articles/294-what-steps-can-be-taken-to-improve-the-accuracy-of-ocr-results-in-paperless).

Хотя предварительная обработка входного изображения повысит точность, также может оказаться полезной постобработка выходного текста.

person ashwin153    schedule 31.03.2014
comment
У меня было хорошее распознавание текста. Но мне приходится делать натяжку уже взятого образа в IOS или Androir. После этого я получаю большое ведро дополнительных персонажей. Я попробовал OCRTest, потому что мне нужно получить только часть идентификатора. Но даже с Примером (OCRTest для Android) я получаю лишние символы или даже нераспознанные строки. Вы использовали какой-либо учебник? - person init-ec; 01.04.2014
comment
Ознакомьтесь с этим руководством (rmtheis.wordpress.com/2011/08/06/). Кроме того, попробуйте использовать изображения с крупными буквами и черно-белой цветовой схемой, как это (data2 .whicdn.com/images/13725579/large.jpg) и увидеть, как выглядит выходной текст. - person ashwin153; 01.04.2014