Распознавание текста в Pytesseract

#python-3.x #python-tesseract

#python-3.x #python-tesseract

Вопрос:

Я впервые занимаюсь программированием. Я хотел бы получить руководство о том, как извлечь текст из паспорта / идентификатора изображения. Используя python-Tesseract OCR, я провел свое исследование документации по Tesseract, но я не получаю достаточного объяснения.

Комментарии:

1. Добро пожаловать на Stack Overflow, здесь не место искать общие рекомендации; пожалуйста, задавайте конкретные вопросы о коде

Ответ №1:

Импортируйте PIL и pytesseract

 import PIL.Image
import pytesseract
  

Загрузите свое изображение

 my_image = PIL.Image.open("Path/To/My_Image.jpg")
  

Запустите tesseract на нем

 my_image_text = pytesseract.image_to_string(my_image)
print(my_image_text)
  

Комментарии:

1. Привет, спасибо, но я получаю сообщение об ошибке. Обратная трассировка (последний последний вызов): файл «C:/Users/user/PycharmProjects/PythonProject1/PythonEye/Image.py «, строка 1, в <module> импортировать файл. Файл изображения «C:UsersuserAppDataRoamingPythonPython38site-packagesPILImage.py «, строка 94, в <модуле> из . импортировать изображение как core ImportError: не удается импортировать имя ‘_imaging’ из ‘PIL’ (C:UsersuserAppDataRoamingPythonPython38site-packagesPIL__init _ .py) и я не понимаю, почему я продолжаю получать эту ошибку.

2. Я погуглил ваше сообщение об ошибке, и, похоже, обычно возникает конфликт при установке PIL и Pillow, поскольку проблемы с установкой в основном зависят от вашей системы, я приглашаю вас выполнить поиск в нем (и в этом случае проблема, похоже, хорошо документирована).