Чтение текста с изображения с помощью Pytesseract выдает ошибку неверного пути

#python #opencv #computer-vision #python-tesseract

#python #opencv #компьютерное зрение #python-tesseract

Вопрос:

Я пытаюсь прочитать текст с изображения с помощью pytesseract. Я использую mac. Я установил pytesseract с помощью pip.

 import cv2
import pytesseract

img = cv2.imread('slika1.png')
text = pytesseract.image_to_string(img)
print(text)
  

Это дает мне эту ошибку:

 pytesseract.pytesseract.TesseractNotFoundError: tesseract is not installed or it's not in your PATH. See README file for more information.
  

когда я делаю это:

 import importlib.util
print(importlib.util.find_spec('pytesseract'))
  

Он печатает:

 ModuleSpec(name='pytesseract', loader=<_frozen_importlib_external.SourceFileLoader object at 0x7f8a7837c160>, origin='/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pytesseract/__init__.py', submodule_search_locations=['/Library/Frameworks/Python.framework/Versions/3.8/lib/python3.8/site-packages/pytesseract'])
  

Итак, что мне делать, что я делаю не так?
Есть ли какой-либо другой способ чтения текста с изображения?

Ответ №1:

Попробуйте открыть исходный файл модуля (от имени администратора) и отредактировать путь к исполняемому файлу Tesseract — при необходимости задайте для него абсолютный путь. В верхних строках должно быть const.

Что-то вроде этого (при Win):

«C:Program FilesPython36Libsite-packagespytesseractpytesseract.py » Задайте путь: … pytesseract.tesseract_cmd = r»D:OCRtesseract.exe «

https://github.com/Twenkid/ComputerVision_Pyimagesearch_OpenCV_Dlib_OCR-Tesseract-DL/blob/master/OCR_Tesseract/ocr.py