#python #ocr #python-tesseract
#питон #распознавание #питон-тессеракт
Вопрос:
Я использую colab, и это мой код
extractedInformation = pytesseract.image_to_string(Image.open("/content/1.jpeg"),lang='chi_tra') print(extractedInformation)
и это показывает
TesseractError: (1, 'Error opening data file /usr/share/tesseract-ocr/4.00/tessdata/chi_tra.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language 'chi_tra' Tesseract couldn't load any languages! Could not initialize tesseract.')
Но когда я устанавливаю lang=’eng’, все работает.
Я пытался установить
!export TESSDATA_PREFIX="/usr/share/tesseract-ocr/4.00/tessdata"
чтобы указать мой каталог tessdata, но он не может работать.
И я проверил доступные языки по этому:
tesseract --list-langs
и
List of available languages (3): chi_tra osd eng
Разве это не означает, что я могу установить lang=’chi_tra’?
Это меня смутило.
Это проблема с версией traineddata?