Имам куп некомпресирани битонални TIF изображения на документи. Всички те имат воден знак в средата. Когато ги пусна през OCR, текстът, който се припокрива с водния знак, не се разпознава. Опитвам се да видя дали мога да приложа някакъв тип почистване, за да премахна тези водни знаци, за да мога да разпозная липсващия текст.
Отново изображенията са черно-бели, но когато погледнете водния знак, той изглежда сив, тъй като има модел от черни и бели пиксели, което прави буквите във водния знак по-малко „плътни“ от обикновения текст. В същото време буквите на водния знак са много големи, много по-големи от обикновения текст.
Пример за донякъде подобно изображение е това (освен този е цветен и символите на водния знак в моя случай са много по-дебели и по-големи; моите водни знаци също са много по-къси: дълги са само 3 до 4 букви)
Изглежда, че може да има някакъв филтър за почистване, който би бил подобен на премахването на големи черни граници от изображение, с изключение на това, че границите обикновено са „по-плътни“ от водния знак, така че изглеждат „по-черни“.
Имам 3 инструмента на мое разположение: GIMP, ImageMagick и IrfanView. Можете ли да препоръчате някакви специфични функции на която и да е подгрупа от тези инструменти, които могат да ми помогнат?
:)
Сигурен съм, че това ще работи в общия случай, въпреки че YMWV както винаги. - person halfer   schedule 08.03.2013