У меня есть такое изображение (белый фон и черный текст). Если нет шума (как вы можете видеть: верхняя и нижняя части числовой строки имеют много шума), Tesseract может очень хорошо распознать число.
Но когда есть шум, Tesseract пытается распознать его как число и добавить еще число к результату. Это действительно плохо. Как заставить Tesseract игнорировать шум? Я не могу сделать изображение с предварительной обработкой, чтобы сделать его более контрастным или четким. Это ничего не помогает.
Если какой-то инструмент может выделить только строчку. Это может быть действительно хорошим вкладом в Tesseract. Пожалуйста помогите. Спасибо всем.