#math
#математика
Вопрос:
В настоящее время я извлекаю буквы из изображения, чтобы написать распознаватель букв, используя сверточную нейронную сеть. Информация, которую я получаю из изображения текста, — это положение каждой буквы на самом изображении. Что я пытаюсь сделать, так это определить, где заканчивается слово, чтобы я мог вставить пробел при печати моего результата. Разрыв строки довольно прост, поскольку расстояние от текущей буквы до следующей буквы отрицательное, и именно так я определяю разрыв строки. Теперь определить, есть ли пробел между двумя буквами, кажется не таким простым.
Вещи, которые я пробовал:
-
Установите пороговое значение (30 пикселей)
- Работал для очень специфических текстов
-
Вычислить среднее значение всех расстояний, исключая отрицательные
- Также работало только для определенных текстов
Кто-нибудь знает о стандартизированном способе определения, есть ли пробел между двумя буквами на изображении текста? (Это должно быть независимо от шрифта и тому подобного)
Комментарии:
1. Я думаю, вы сильно недооцениваете сложность этой проблемы. Во-первых, это явно не тот случай, когда разрыв строки может быть обнаружен по отрицательному сдвигу по горизонтали. Что, если я укажу начало абзацев, сделав в них отступ, как это обычно бывает, а последняя строка абзаца окажется очень короткой? Если последняя строка короче отступа, который открывает следующий абзац, ваш алгоритм прерывается. Вы не сможете сесть и решить эту задачу с нуля.
2. Да, вы правы, это можно было бы решить, приняв во внимание координату y буквы, если я не ошибаюсь, проблема с пробелом все еще остается, хотя.