Свързани публикации 'tesseract'
Как да създадете JavaScript баркод скенер с Tesseract.js OCR
Преди това споделих статия, демонстрираща как да използвам Tesseract Python OCR за „разпознаване на придружаващия текст“ на 1D баркод. В тази статия ще променя езика за програмиране на JavaScript, създавайки приложение за сканиране на баркод на JavaScript, интегрирано с Tesseract JavaScript OCR.
Как да използвате JavaScript OCR за разпознаване на 1D баркод текст
Когато търсим „JavaScript OCR“ в Google, първият от върнатите резултати е Tesseract.js , който е JS обвивка, изградена с..
Тесеракт. Разпознаване на грешки в софтуера за разпознаване
Tesseract е безплатна софтуерна програма за разпознаване на текст, разработена от Google. Според описанието на проекта, „Tesseract е може би най-точният наличен OCR двигател с отворен код“. И какво, ако се опитаме да хванем някои грешки там с помощта на анализатора на PVS-Studio?
Тесеракт
Tesseract е механизъм за оптично разпознаване на знаци за различни операционни системи и е безплатен софтуер, първоначално разработен като патентован софтуер в лабораториите на Hewlett Packard..
Свързани въпроси 'tesseract'
папката libs в tess-two и eyes-two са празни
Така че успешно създадох tess-two, използвайки следните команди
git clone git://github.com/rmtheis/tess-two tess
cd tess
cd tess-two
ndk-build -path '~/Desktop/OCR/tess/eyes-two/jni'
android update project --target 6--path .
ant release...
204 изгледи
schedule
15.09.2022
изходът на teseract е в един ред вместо в няколко реда
Опитах се да използвам tesseract за ocr и разпознаването е наред.
искам да разпознавам адресите от писмото. когато го прочетох се случва следното:
вход:
Name Name
Street
Code City
изход: Име NameStreetCode Град
Опитах всички -psm...
626 изгледи
schedule
18.09.2022
Премахване на допълнителни пиксели/линии от регистрационния номер
Използвам HOG детектор на функции въз основа на SVM класификация. Мога успешно да извлека регистрационен номер, но извлеченият номер има някои ненужни пиксели/линии освен номера на лиценза. Моят канал за обработка на изображения е както следва:...
733 изгледи
schedule
30.09.2022
Как да направите Тесеракт по-бърз [затворено]
Това е дълъг шанс, но трябва да попитам. Имам нужда от всякакви идеи, които могат да направят Tesseract OCR двигателя по-бърз. Обработвам 2 милиона PDF файлове, състоящи се от около 20 милиона страници текст, и трябва да постигна всяка частица от...
6217 изгледи
schedule
01.10.2022
как да извлечете текст от сканирани документи с помощта на python
Опитах този пример, https://github.com/madmaze/pytesseract
import Image
import pytesseract
print pytesseract.image_to_string(Image.open('image1.png'))
Получаване на грешка: Файл „/usr/lib/python2.7/subprocess.py“, ред 1327, в...
1836 изгледи
schedule
01.10.2022
Интегрирайте Tesseract OCR двигател в Android
Как можем да използваме Tesseract OCR двигателя в нашия проект за Android за четене на знаците в изображение..как да го инсталирам на android?? Моля помогнете
6636 изгледи
schedule
11.11.2023
Помощ за скрипт на Shell, как да пропусна файл за докладване на грешка?
Текущият ми shell скрипт е така:
for i in *.pdf
do
convert -density 400 $i -depth 8 ${i/pdf/jpg}
done
for j in *.jpg
do
tesseract -l eng $j ${j/.jpg}
rm $j
mv ${j}.txt textfile
done
Така че това, което грубо прави, е, че за...
406 изгледи
schedule
17.11.2022
teseract не чете текст и число, което има фоново изображение с помощта на java
Опитах се да прочета изображение с помощта на tess4j(1.1) за tesseract, но не можах да прочета тези числа/символи, които имат фоново изображение, така че приложих прагове върху изображението и промяната на изображението на черно-бяло, но също така...
2241 изгледи
schedule
22.11.2023
Внедряване на OCR за приложението Heroku Rails
Имам нужда от възможност за OCR за приложение на Rails на Heroku. Усилията ми да накарам teseract да работи не са успешни. Някой има ли предложения? Трудно е да се повярва, че нещо толкова основно като OCR не се поддържа от нещо толкова вездесъщо...
3474 изгледи
schedule
12.10.2022
Конвертирайте сканирани pdf в .txt файлове с помощта на teseract
Трябва да конвертирам .pdf файл, съдържащ сканирани изображения, в .txt файла. tesseract ocr преобразува само изображения в .txt , но трябва първо да извлека .tif изображенията и след това да ги конвертирам. Може ли някой да ми помогне с...
17951 изгледи
schedule
18.11.2023
Tesseract OCR ID за четене за Android
Опитвам се да внедря teseract (tess-two) за четене на данни от един ID или проверка. Може ли някой да го е направил? В момента имам проблеми с разпознаването на текста. Резултатът има много допълнителни знаци
685 изгледи
schedule
13.11.2022
Tesseract OCR не работи за 64-битова машина
Работя върху приложение, в което използвам Tesseract за OCR.
Моят код работи абсолютно добре в Windows 32 битова система. Но когато се опитам да стартирам същия код в 64-битова машина, използвайки 32-битовите .dll файлове, кодът се изпълнява, но...
2948 изгледи
schedule
28.11.2023
Как се инсталира Tesseract-OCR 3.03 в дистрибуции на Ubuntu/Linux?
Един приятел и аз се интересуваме от обучението на tesseract-OCR двигателя за CV проект. Опитахме да използваме някои обвивки като PyTesser и pyocr, но резултатите в момента не са толкова точни, колкото ни трябва. Поради това искаме да опитаме да...
38683 изгледи
schedule
01.11.2022
Захранете тесеракт (Tess4J) от ImageMagick (JMagick)
Опитвам се да създам Java програма, която ще OCR много формати на изображения. Изображенията не могат да се четат директно от файла, тъй като техните байтове трябва да бъдат изпратени през мрежата.
В момента мога да чета необработени байтове...
462 изгледи
schedule
10.11.2022
Как да персонализирате Tesseract игнорира шум?
Имам изображение като това (бял фон и черен текст). Ако няма шум (както можете да видите: в горната и долната част на числовата линия има много шум), Tesseract може да разпознае числото много добре.
Но когато има шум, Tesseract се опитва да го...
2745 изгледи
schedule
07.01.2024
Може ли Tesseract да бъде настроен само на OCR (без промяна на изображението), когато създавате PDF?
Има ли начин да принудите Tesseract да прави само OCR и да остави оригиналните изображения непокътнати? В момента използвам командата:
tesseract -l eng file.tif file pdf
за да произведете file.pdf от многостраничен tif файл. Проблемът ми...
325 изгледи
schedule
12.11.2023
Изграждане на тесеракт без лептоника
Трябва да създам тесеракт без зависимост от leptonica за някаква работа (за пренасяне с помощта на emscripten). Разгледах make файловете и изглежда, че teseract изисква заглавни файлове leptonica и lib файлове, за да се изгради.
Предоставянето на...
739 изгледи
schedule
24.11.2022
Разпознаването на изображение към текст с помощта на Tesseract-OCR е по-добро, когато изображението е предварително обработено ръчно с помощта на Gimp, отколкото моя код на Python
Опитвам се да напиша код на Python за ръчна предварителна обработка и разпознаване на изображения с помощта на Tesseract-OCR.
Ръчен процес: За ръчно разпознаване на текст за едно изображение, обработвам предварително изображението с помощта на...
8510 изгледи
schedule
29.11.2023
Чисто монохромно изображение с Imagemagik в iOS
Опитвам се да създам код, който ми позволява да изчиствам изображения, които да бъдат прочетени от и OCR машина. Досега не успях да постигна много. Инсталирайте Imagemagink само на моя проект за iOS и използвайте някои от функциите на API, за да...
190 изгледи
schedule
23.02.2024
Каква е разликата между tesseract и Tessnet?
Търсих урок или някои насоки как да настроя tesseract или tessnet и tesseract wiki казва само за обучение на tesseract 3.01 или 2.0x. Мога ли да знам каква е разликата между tessnet и tesseract? И кой трябва да използвам в c# приложение? след...
2151 изгледи
schedule
10.03.2024