Я пытаюсь создать CUSTOM язык для обнаружения только следующих символов:
['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '<', '<<<', '/']
У меня есть почти 50 изображений, для которых я сгенерировал бокс-файлы, исправил ошибки. Мой вопрос заключается в том, чтобы обучить tesseract для вышеуказанных настраиваемых символов, необходимо ли использовать изображения, созданные с помощью инструмента tesseract, которые также будут использоваться в качестве входных данных при создании cust.traindata
Я сделал код, который из приведенного выше массива занимает 5 символов и создает изображение с помощью инструмента tesseract, а затем генерирует файл .box, который является правильным и не требует настройки для всех возможных конфигураций, но поскольку tesseract создан, он ему нужен для создания cust.traindata.
Заранее спасибо.