#python #ocr #python-tesseract
#питон #распознавание #питон-тессеракт
Вопрос:
Я пытаюсь получить номера карт Бинго с карт Бинго, которые будут отформатированы как n1|n2|n3|n4|n5
или помещены в список, например [n1, n2, n3, n4, n5]
, для каждой строки
Это мой текущий код:
import cv2 import pytesseract pytesseract.pytesseract.tesseract_cmd = r"C:Tesseract-OCRtesseract.exe" image = cv2.imread("card.jpg") image = cv2.resize(image, (1200, 1000), fx=0.5, fy=0.5) gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) thr = cv2.adaptiveThreshold(gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV, 301, 11) cv2.imshow('img', thr) cv2.waitKey(0) print(pytesseract.image_to_string(thr, config="--oem 3 --psm 12 -c tessedit_char_whitelist=0123456789|"))
Тестовое Изображение: Бинго-карта
И вот что я получаю в качестве вывода:
3 2|16|40|56|74 4|25|41|52|70 13 6792|462 10|26|43|60|72 4044 29|44 31792|6792