Tesseract OCR распознает 9 как S

#python #ocr #tesseract

#python #ocr #тессеракт

Вопрос:

У меня такая проблема: в некоторых случаях мой код распознает 9 как S, а в некоторых случаях все нормально. Я перепробовал все методы исправления: изменил конфиг, а также полностью оптимизировал картинку, чтобы tesseract мог определять текст с большой точностью, но, видимо, это не помогло. У вас есть какие-либо идеи по этому поводу?

Это моя пользовательская конфигурация: config = ‘—oem 1 —psm 13’

Ниже я прикрепил изображения, на которых tesseract распознает 9 как S, и когда он распознает 9 как 9

https://i.stack.imgur.com/xKyEi.jpg — 1

https://i.stack.imgur.com/mfOVw.jpg — 2

На первом рисунке он распознал текст следующим образом: WSNU-AJ6T-4M2M

На втором рисунке он распознал текст следующим образом: VAPI-29UI-WAPI