Свързани публикации 'tesseract'


Как да създадете JavaScript баркод скенер с Tesseract.js OCR
Преди това споделих статия, демонстрираща как да използвам Tesseract Python OCR за „разпознаване на придружаващия текст“ на 1D баркод. В тази статия ще променя езика за програмиране на JavaScript, създавайки приложение за сканиране на баркод на JavaScript, интегрирано с Tesseract JavaScript OCR. Как да използвате JavaScript OCR за разпознаване на 1D баркод текст Когато търсим „JavaScript OCR“ в Google, първият от върнатите резултати е Tesseract.js , който е JS обвивка, изградена с..

Тесеракт. Разпознаване на грешки в софтуера за разпознаване
Tesseract е безплатна софтуерна програма за разпознаване на текст, разработена от Google. Според описанието на проекта, „Tesseract е може би най-точният наличен OCR двигател с отворен код“. И какво, ако се опитаме да хванем някои грешки там с помощта на анализатора на PVS-Studio? Тесеракт Tesseract е механизъм за оптично разпознаване на знаци за различни операционни системи и е безплатен софтуер, първоначално разработен като патентован софтуер в лабораториите на Hewlett Packard..

Свързани въпроси 'tesseract'

папката libs в tess-two и eyes-two са празни
Така че успешно създадох tess-two, използвайки следните команди git clone git://github.com/rmtheis/tess-two tess cd tess cd tess-two ndk-build -path '~/Desktop/OCR/tess/eyes-two/jni' android update project --target 6--path . ant release...
204 изгледи
schedule 15.09.2022

изходът на teseract е в един ред вместо в няколко реда
Опитах се да използвам tesseract за ocr и разпознаването е наред. искам да разпознавам адресите от писмото. когато го прочетох се случва следното: вход: Name Name Street Code City изход: Име NameStreetCode Град Опитах всички -psm...
626 изгледи
schedule 18.09.2022

Премахване на допълнителни пиксели/линии от регистрационния номер
Използвам HOG детектор на функции въз основа на SVM класификация. Мога успешно да извлека регистрационен номер, но извлеченият номер има някои ненужни пиксели/линии освен номера на лиценза. Моят канал за обработка на изображения е както следва:...
733 изгледи

Как да направите Тесеракт по-бърз [затворено]
Това е дълъг шанс, но трябва да попитам. Имам нужда от всякакви идеи, които могат да направят Tesseract OCR двигателя по-бърз. Обработвам 2 милиона PDF файлове, състоящи се от около 20 милиона страници текст, и трябва да постигна всяка частица от...
6217 изгледи
schedule 01.10.2022

как да извлечете текст от сканирани документи с помощта на python
Опитах този пример, https://github.com/madmaze/pytesseract import Image import pytesseract print pytesseract.image_to_string(Image.open('image1.png')) Получаване на грешка: Файл „/usr/lib/python2.7/subprocess.py“, ред 1327, в...
1836 изгледи

Интегрирайте Tesseract OCR двигател в Android
Как можем да използваме Tesseract OCR двигателя в нашия проект за Android за четене на знаците в изображение..как да го инсталирам на android?? Моля помогнете
6636 изгледи
schedule 11.11.2023

Помощ за скрипт на Shell, как да пропусна файл за докладване на грешка?
Текущият ми shell скрипт е така: for i in *.pdf do convert -density 400 $i -depth 8 ${i/pdf/jpg} done for j in *.jpg do tesseract -l eng $j ${j/.jpg} rm $j mv ${j}.txt textfile done Така че това, което грубо прави, е, че за...
406 изгледи
schedule 17.11.2022

teseract не чете текст и число, което има фоново изображение с помощта на java
Опитах се да прочета изображение с помощта на tess4j(1.1) за tesseract, но не можах да прочета тези числа/символи, които имат фоново изображение, така че приложих прагове върху изображението и промяната на изображението на черно-бяло, но също така...
2241 изгледи
schedule 22.11.2023

Внедряване на OCR за приложението Heroku Rails
Имам нужда от възможност за OCR за приложение на Rails на Heroku. Усилията ми да накарам teseract да работи не са успешни. Някой има ли предложения? Трудно е да се повярва, че нещо толкова основно като OCR не се поддържа от нещо толкова вездесъщо...
3474 изгледи
schedule 12.10.2022

Конвертирайте сканирани pdf в .txt файлове с помощта на teseract
Трябва да конвертирам .pdf файл, съдържащ сканирани изображения, в .txt файла. tesseract ocr преобразува само изображения в .txt , но трябва първо да извлека .tif изображенията и след това да ги конвертирам. Може ли някой да ми помогне с...
17951 изгледи
schedule 18.11.2023

Tesseract OCR ID за четене за Android
Опитвам се да внедря teseract (tess-two) за четене на данни от един ID или проверка. Може ли някой да го е направил? В момента имам проблеми с разпознаването на текста. Резултатът има много допълнителни знаци
685 изгледи
schedule 13.11.2022

Tesseract OCR не работи за 64-битова машина
Работя върху приложение, в което използвам Tesseract за OCR. Моят код работи абсолютно добре в Windows 32 битова система. Но когато се опитам да стартирам същия код в 64-битова машина, използвайки 32-битовите .dll файлове, кодът се изпълнява, но...
2948 изгледи
schedule 28.11.2023

Как се инсталира Tesseract-OCR 3.03 в дистрибуции на Ubuntu/Linux?
Един приятел и аз се интересуваме от обучението на tesseract-OCR двигателя за CV проект. Опитахме да използваме някои обвивки като PyTesser и pyocr, но резултатите в момента не са толкова точни, колкото ни трябва. Поради това искаме да опитаме да...
38683 изгледи
schedule 01.11.2022

Захранете тесеракт (Tess4J) от ImageMagick (JMagick)
Опитвам се да създам Java програма, която ще OCR много формати на изображения. Изображенията не могат да се четат директно от файла, тъй като техните байтове трябва да бъдат изпратени през мрежата. В момента мога да чета необработени байтове...
462 изгледи
schedule 10.11.2022

Как да персонализирате Tesseract игнорира шум?
Имам изображение като това (бял фон и черен текст). Ако няма шум (както можете да видите: в горната и долната част на числовата линия има много шум), Tesseract може да разпознае числото много добре. Но когато има шум, Tesseract се опитва да го...
2745 изгледи
schedule 07.01.2024

Може ли Tesseract да бъде настроен само на OCR (без промяна на изображението), когато създавате PDF?
Има ли начин да принудите Tesseract да прави само OCR и да остави оригиналните изображения непокътнати? В момента използвам командата: tesseract -l eng file.tif file pdf за да произведете file.pdf от многостраничен tif файл. Проблемът ми...
325 изгледи
schedule 12.11.2023

Изграждане на тесеракт без лептоника
Трябва да създам тесеракт без зависимост от leptonica за някаква работа (за пренасяне с помощта на emscripten). Разгледах make файловете и изглежда, че teseract изисква заглавни файлове leptonica и lib файлове, за да се изгради. Предоставянето на...
739 изгледи
schedule 24.11.2022

Разпознаването на изображение към текст с помощта на Tesseract-OCR е по-добро, когато изображението е предварително обработено ръчно с помощта на Gimp, отколкото моя код на Python
Опитвам се да напиша код на Python за ръчна предварителна обработка и разпознаване на изображения с помощта на Tesseract-OCR. Ръчен процес: За ръчно разпознаване на текст за едно изображение, обработвам предварително изображението с помощта на...
8510 изгледи

Чисто монохромно изображение с Imagemagik в iOS
Опитвам се да създам код, който ми позволява да изчиствам изображения, които да бъдат прочетени от и OCR машина. Досега не успях да постигна много. Инсталирайте Imagemagink само на моя проект за iOS и използвайте някои от функциите на API, за да...
190 изгледи

Каква е разликата между tesseract и Tessnet?
Търсих урок или някои насоки как да настроя tesseract или tessnet и tesseract wiki казва само за обучение на tesseract 3.01 или 2.0x. Мога ли да знам каква е разликата между tessnet и tesseract? И кой трябва да използвам в c# приложение? след...
2151 изгледи
schedule 10.03.2024