Вычислить длину пробелов изображения текста

#math

#математика

Вопрос:

В настоящее время я извлекаю буквы из изображения, чтобы написать распознаватель букв, используя сверточную нейронную сеть. Информация, которую я получаю из изображения текста, — это положение каждой буквы на самом изображении. Что я пытаюсь сделать, так это определить, где заканчивается слово, чтобы я мог вставить пробел при печати моего результата. Разрыв строки довольно прост, поскольку расстояние от текущей буквы до следующей буквы отрицательное, и именно так я определяю разрыв строки. Теперь определить, есть ли пробел между двумя буквами, кажется не таким простым.

Вещи, которые я пробовал:

  1. Установите пороговое значение (30 пикселей)

    • Работал для очень специфических текстов
  2. Вычислить среднее значение всех расстояний, исключая отрицательные

    • Также работало только для определенных текстов

Кто-нибудь знает о стандартизированном способе определения, есть ли пробел между двумя буквами на изображении текста? (Это должно быть независимо от шрифта и тому подобного)

Комментарии:

1. Я думаю, вы сильно недооцениваете сложность этой проблемы. Во-первых, это явно не тот случай, когда разрыв строки может быть обнаружен по отрицательному сдвигу по горизонтали. Что, если я укажу начало абзацев, сделав в них отступ, как это обычно бывает, а последняя строка абзаца окажется очень короткой? Если последняя строка короче отступа, который открывает следующий абзац, ваш алгоритм прерывается. Вы не сможете сесть и решить эту задачу с нуля.

2. Да, вы правы, это можно было бы решить, приняв во внимание координату y буквы, если я не ошибаюсь, проблема с пробелом все еще остается, хотя.