Я пытаюсь обнаружить бангла-символ на изображении с помощью python, поэтому я решил использовать pytesseract. Для этой цели я использовал следующий код:
import pytesseract
from PIL import Image, ImageEnhance, ImageFilter
im = Image.open("input.png") # the second one
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.png')
pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'
text = pytesseract.image_to_string(Image.open('temp2.png'),lang="ben")
print text
Проблема в том, что если я дал изображение английского символа, он обнаруживает. Но когда я пишу lang="ben"
и определяю по изображению бенгальских символов, мой код работает бесконечное время или вечно.
P.S. Я загрузил данные поезда на бенгальском языке в папку tessdata и пытаюсь запустить их в PyCharm.
Может ли кто-нибудь помочь мне решить эту проблему?