Обновление TesseractDotNet до последней версии

Я работаю над проектом OCR, где мне нужно преобразовать изображения в текст. Если бы мне пришлось использовать только английский язык, то я мог бы заставить Tesseract работать, однако, поскольку мне нужно конвертировать также русские тексты, это становится более громоздким. Я использую tesseractdotnet v301_r590 (последний, насколько мне известно) со следующего сайта, который отлично работает с языковыми данными 3.01:

https://code.google.com/p/tesseractdotnet/downloads/list

Однако при просмотре языковых данных для русского языка я вижу только версию 3.02 (которая несовместима с текущей версией tesseractdotnet v301_r590). Я попытался загрузить исходные коды для оригинального tesseract (код C++) и попытался создать из него dll; однако я даже не могу его запустить (может быть, потому что я использую VS 2012? У меня есть Visual C++ 2008, как того требовали создатели).

Поэтому мой вопрос: как я могу обновить tesseractdotnet, чтобы он работал с данными языка 3.02, пожалуйста?


person Robert J.    schedule 30.06.2014    source источник


Ответы (1)


Используйте обертку .Net для tesseract-ocr от Charles Weld — она совместима с версией 3.02.

person nguyenq    schedule 18.07.2014