Python pytesseract : Пожалуйста, убедитесь, что переменная среды TESSDATA_PREFIX установлена в ваш каталог «tessdata».

#python #ocr #python-tesseract

#питон #распознавание #питон-тессеракт

Вопрос:

Я использую colab, и это мой код

 extractedInformation = pytesseract.image_to_string(Image.open("/content/1.jpeg"),lang='chi_tra') print(extractedInformation)  

и это показывает

 TesseractError: (1, 'Error opening data file /usr/share/tesseract-ocr/4.00/tessdata/chi_tra.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory. Failed loading language 'chi_tra' Tesseract couldn't load any languages! Could not initialize tesseract.')  

Но когда я устанавливаю lang=’eng’, все работает.
Я пытался установить

 !export TESSDATA_PREFIX="/usr/share/tesseract-ocr/4.00/tessdata"  

чтобы указать мой каталог tessdata, но он не может работать.
И я проверил доступные языки по этому:

 tesseract --list-langs  

и

 List of available languages (3): chi_tra osd eng  

Разве это не означает, что я могу установить lang=’chi_tra’?
Это меня смутило.
Это проблема с версией traineddata?