Публикации по теме 'tesseract'


Как создать сканер штрих-кода на JavaScript с помощью Tesseract.js OCR
Ранее я поделился статьей, демонстрирующей, как использовать Tesseract Python OCR для распознавания сопроводительного текста одномерного штрих-кода. В этой статье я изменю язык программирования на JavaScript, создав приложение для сканирования штрих-кода JavaScript, интегрированное с Tesseract JavaScript OCR. Как использовать JavaScript OCR для распознавания текста одномерного штрих-кода Когда мы ищем JavaScript OCR в Google, первым из возвращаемых результатов является Tesseract.js..

Тессеракт. Распознавание ошибок в программе распознавания
Tesseract — бесплатная программа для распознавания текста, разработанная Google. Согласно описанию проекта, «Tesseract, вероятно, является наиболее точным доступным механизмом распознавания текста с открытым исходным кодом». А что, если мы попытаемся отловить там какие-то баги с помощью анализатора PVS-Studio? Тессеракт Tesseract — это механизм оптического распознавания символов для различных операционных систем и представляет собой бесплатное программное обеспечение, первоначально..

Вопросы по теме 'tesseract'

Интегрировать движок Tesseract OCR в Android
Как мы можем использовать движок Tesseract OCR в нашем Android-проекте для чтения символов на изображении... как мне установить его на Android?? Пожалуйста помоги
6636 просмотров
schedule 11.11.2023

В чем разница между тессерактом и теснетом?
Я искал учебник или какое-то руководство о том, как настроить tesseract или tessnet, и в вики tesseract говорится только об обучении tesseract 3.01 или 2.0x. Могу ли я узнать, в чем разница между tessnet и tesseract? И какой из них я должен...
2151 просмотров
schedule 10.03.2024

tesseract не читает текст и число, которое имеет фоновое изображение, используя java
Я попытался прочитать изображение с помощью tess4j (1.1) для tesseract, но не смог прочитать те числа / символы, которые имеют фоновое изображение, поэтому я применил пороговую обработку изображения и изменение изображения на черно-белое, но проблема...
2241 просмотров
schedule 22.11.2023

Как настроить Tesseract игнорирует шум?
У меня есть такое изображение (белый фон и черный текст). Если нет шума (как вы можете видеть: верхняя и нижняя части числовой строки имеют много шума), Tesseract может очень хорошо распознать число. Но когда есть шум, Tesseract пытается...
2745 просмотров
schedule 07.01.2024

Справка по сценарию оболочки, как пропустить файл отчета об ошибках?
Мой текущий сценарий оболочки выглядит следующим образом: for i in *.pdf do convert -density 400 $i -depth 8 ${i/pdf/jpg} done for j in *.jpg do tesseract -l eng $j ${j/.jpg} rm $j mv ${j}.txt textfile done Итак, что он...
406 просмотров
schedule 17.11.2022

Реализация OCR для приложения Heroku Rails
Мне нужна возможность OCR для приложения Rails на Heroku. Мои попытки заставить tesseract работать не увенчались успехом. У кого-нибудь есть предложения? Трудно поверить, что такая базовая вещь, как OCR, не поддерживается чем-то столь вездесущим,...
3474 просмотров
schedule 12.10.2022

Преобразование отсканированных файлов PDF в файлы .txt с помощью tesseract
Мне нужно преобразовать файл .pdf , содержащий отсканированные изображения, в файлы .txt . tesseract ocr преобразует только изображения в .txt , но мне нужно сначала извлечь .tif изображений и затем преобразовать их. Кто-нибудь может мне с...
17951 просмотров
schedule 18.11.2023

Tesseract читает только цифры из текста
Как я могу получить только числовые значения из изображения, содержащего английский текст. Я использую двигатель tesseract. это код: public static String tesseractOCR(String imgPath, Rectangle rect) { File imageFile = new...
500 просмотров
schedule 23.03.2024

Идентификатор чтения Tesseract OCR для Android
Я пытаюсь реализовать tesseract (tess-two) для чтения данных одного идентификатора или проверки. Мог ли кто-то это сделать? У меня проблемы с распознаванием текста. Результат имеет много лишних символов
685 просмотров
schedule 13.11.2022

Tesseract OCR не работает на 64-битной машине
Я работаю над приложением, в котором использую Tesseract для OCR. Мой код отлично работает в 32-битной системе Windows. Но когда я пытаюсь запустить тот же код на 64-битной машине, используя 32-битные файлы .dll, код работает, но тогда код не дает...
2948 просмотров
schedule 28.11.2023

Как установить Tesseract-OCR 3.03 в дистрибутивы Ubuntu / Linux?
Мы с другом заинтересованы в обучении движка tesseract-OCR для проекта CV. Мы пробовали использовать некоторые оболочки, такие как PyTesser и pyocr, но результаты в настоящее время не так точны, как нам нужно. Таким образом, мы хотим попробовать...
38683 просмотров
schedule 01.11.2022

Обновление TesseractDotNet до последней версии
Я работаю над проектом OCR, где мне нужно преобразовать изображения в текст. Если бы мне пришлось использовать только английский язык, то я мог бы заставить Tesseract работать, однако, поскольку мне нужно конвертировать также русские тексты, это...
1042 просмотров
schedule 31.03.2024

Поток tesseract (Tess4J) от ImageMagick (JMagick)
Я пытаюсь создать программу Java, которая будет распознавать многие форматы изображений. Изображения не могут быть прочитаны напрямую из файла, потому что их байты должны передаваться по сети. В настоящее время я могу читать необработанные байты...
462 просмотров
schedule 10.11.2022

Удаление лишних пикселей / линий с номерного знака
Я использую детектор функций HOG на основе классификации SVM. Я могу успешно извлечь номерной знак, но на извлеченном номерном знаке есть некоторые ненужные пиксели / линии, кроме номера лицензии. Мой конвейер обработки изображений выглядит...
733 просмотров

Очистите монохромное изображение с помощью Imagemagik в iOS
Я пытаюсь создать код, который позволяет мне очищать изображения для чтения и механизма OCR. Пока мне не удалось многого добиться. Установите Imagemagink только в моем проекте iOS и используйте некоторые функции API для создания изображения в...
190 просмотров

Можно ли настроить Tesseract только на OCR (без изменения изображения) при создании PDF?
Есть ли способ заставить Tesseract выполнять только распознавание текста и оставить исходные изображения нетронутыми? На данный момент я использую команду: tesseract -l eng file.tif file pdf для создания file.pdf из многостраничного файла...
325 просмотров
schedule 12.11.2023

Метод вызова end() в tess-two вызывает сбой приложения
Я использую tess-two без проблем, но когда я вызываю TessBaseAPI.end(), приложение вылетает. Отображается это сообщение журнала. 06-26 09:06:18.065 2347-14702/? I/ActivityManager﹕ Killing proc 14146:br.com.nglauber.app.ocr/u0a10163: force stop...
438 просмотров
schedule 03.03.2024

Создание тессеракта без лептоники
Мне нужно собрать tesseract без зависимости от leptonica для некоторой работы (для переноса с использованием emscripten). Я просмотрел файлы make, и кажется, что для сборки tesseract требуются заголовочные файлы leptonica и файлы lib....
739 просмотров
schedule 24.11.2022

Распознавание изображения в текст с использованием Tesseract-OCR лучше, когда изображение предварительно обрабатывается вручную с помощью GIMP, чем мой код Python
Я пытаюсь написать код на Python для ручной предварительной обработки и распознавания изображений с помощью Tesseract-OCR. Ручная обработка: Чтобы вручную распознать текст для одного изображения, я предварительно обрабатываю изображение с помощью...
8510 просмотров

Отключить OCR с помощью словаря в tesseract C++ API
У меня есть приложение, в котором технические спецификации распознаются с помощью API tesseract. Я инициализирую это так: tesseract::TessBaseAPI tess; tess.Init(NULL, "eng", tesseract::OEM_TESSERACT_ONLY); Однако даже после использования...
2682 просмотров
schedule 20.05.2024