Извлечение текста из изображения, содержащего таблицу

#python #opencv #image-processing

#python #opencv #обработка изображений

Вопрос:

У меня есть изображение, которое содержит в себе таблицу. Мне нужно извлечь из него текст. Сначала я попытался удалить горизонтальные и вертикальные линии, но, похоже, это не сработало. Ниже приведен код, который я использовал.

 import cv2

import numpy as np

img = cv2.imread(r'A13205.png')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray, 175, 255, cv2.THRESH_BINARY)[1]

kernel = cv2.getStructuringElement(cv2.MORPH_RECT, (4, 4))
morph_img = cv2.morphologyEx(thresh, cv2.MORPH_CLOSE, kernel)

#inverse the image, so that lines are black for masking
morph_img_inv = cv2.bitwise_not(morph_img)

#perform bitwise_and to mask the lines with provided mask
masked_img = cv2.bitwise_xor(thresh, thresh, mask = morph_img)
  

Входные данные, из которых необходимо извлечь текст

Комментарии:

1. Попробуйте первые образцы из OpenCV: github.com/opencv/opencv_contrib/tree/master/modules/text /…