Я работаю над проектом OCR, где мне нужно преобразовать изображения в текст. Если бы мне пришлось использовать только английский язык, то я мог бы заставить Tesseract работать, однако, поскольку мне нужно конвертировать также русские тексты, это становится более громоздким. Я использую tesseractdotnet v301_r590 (последний, насколько мне известно) со следующего сайта, который отлично работает с языковыми данными 3.01:
https://code.google.com/p/tesseractdotnet/downloads/list
Однако при просмотре языковых данных для русского языка я вижу только версию 3.02 (которая несовместима с текущей версией tesseractdotnet v301_r590). Я попытался загрузить исходные коды для оригинального tesseract (код C++) и попытался создать из него dll; однако я даже не могу его запустить (может быть, потому что я использую VS 2012? У меня есть Visual C++ 2008, как того требовали создатели).
Поэтому мой вопрос: как я могу обновить tesseractdotnet, чтобы он работал с данными языка 3.02, пожалуйста?