Как получить текст из изображения с помощью pytesseract?

#python-3.x #anaconda #python-imaging-library #spyder #python-tesseract

#python-3.x #анаконда #python-imaging-library #spyder #python-тессеракт

Вопрос:

У меня есть сценарий, в котором я должен извлечь некоторый текст из изображения. Но при попытке сделать это я получаю следующие ошибки:

 runfile('/Users/vivekchowdary/Documents/untitled 
folder/pytesseract.py', 
wdir='/Users/vivekchowdary/Documents/untitled folder')
Traceback (most recent call last):

File "<ipython-input-3-95284fad16df>", line 1, in <module>
runfile('/Users/vivekchowdary/Documents/untitled 
folder/pytesseract.py', 
wdir='/Users/vivekchowdary/Documents/untitled folder')

File "/anaconda3/lib/python3.7/site- 
packages/spyder_kernels/customize/spydercustomize.py", line 704, in 
runfile
execfile(filename, namespace)

File "/anaconda3/lib/python3.7/site- 
packages/spyder_kernels/customize/spydercustomize.py", line 108, in 
execfile
exec(compile(f.read(), filename, 'exec'), namespace)

File "/Users/vivekchowdary/Documents/untitled 
folder/pytesseract.py", line 3, in <module>
from pytesseract import *

File "/Users/vivekchowdary/Documents/untitled 
folder/pytesseract.py", line 6, in <module>
text = image_to_string(image_file)

NameError: name 'image_to_string' is not defined
  

Я использовал следующий код:

 `from PIL import Image
from matplotlib import pyplot as plt
from pytesseract import *
image_file='/Users/vivekchowdary/Documents/untitled 
folder/Scan0013.jpg'
im=Image.open(image_file)
text = image_to_string(image_file)
print ("=====output=======n")
print (text)`
  

Мой ожидаемый результат заключается в том, что он должен извлечь весь текст из изображения «jpg» и распечатать его на экране.

Комментарии:

1. Я думаю, что эта проблема должна быть решена, если вы переименуете файл, который Пытаетесь запустить, т. Е. /Users/vivekchowdary/Documents/untitled folder/pytesseract.py На что-то другое, чем pytesseract.py . Это потому pytesseract , что это имя модуля, который вы пытаетесь использовать, поэтому вы не можете называть свои файлы с тем же именем, иначе вы заставите Python ошибочно предположить, что ваш файл — это сам модуль.

2. @CarlosCordoba вы были правы. Я попытался изменить имя файла, и я не получил предыдущую ошибку. Но на этот раз он говорит «TesseractNotFoundError: tesseract не установлен или его нет на вашем пути». Проблема здесь в том, что я уже установил tesseract. Не могли бы вы помочь мне указать его путь?