#android #machine-learning #ocr #google-cloud-vision
#Android #машинное обучение #распознавание текста #google-cloud-vision
Вопрос:
Итак, я пытаюсь реализовать личный проект на Android, где вы можете сканировать различные квитанции из торговых центров. Я хочу создать модуль, который немного помогает пользователям вводить данные вручную, автоматизируя как можно больше действий. Ситуация такова:
-
Я хотел бы получить общую сумму квитанции, зная, что в качестве стандарта ее можно найти в строке, подобной этой: TOTAL……….. 33.9 Валюта. Как я могу на самом деле получить блоки, которые находятся на одной оси с блоком, содержащим «Total»?
-
То же самое относится к каждому отдельному продукту, я хотел бы взять значения каждого отдельного товара в корзине и его стоимость и поместить это в текст редактирования в Android, чтобы пользователь мог выполнить окончательное повторное касание.
Пример получения:
Комментарии:
1. К сожалению, он не поддерживает мой язык. Таким образом, результаты не совсем точны :/
Ответ №1:
Это похоже на идею проекта, а не на вопросы кодирования.
Я предлагаю угадать блоки по относительному расположению ограничивающих рамок.
Однако это сложная исследовательская задача. Возможно, Vision API откроет какую-нибудь функцию для клиентов, позволяющую напрямую понимать квитанции.
Ответ №2:
Чтобы получить текст построчно, вам необходимо настроить пользовательскую логику, которая обрабатывала бы строки на основе символов, возвращаемых Google Vision API, что может выполняться в соответствии со следующими шагами:
- Создайте коллекцию всех символов, возвращаемых в
TextAnnotation
- Выполните итерацию по коллекции и создайте строку,
string
основанную на проверке координаты X первого символа, котораяgivenSymbol.BoundingBox.Vertices[2].X
сопоставляется с координатами X всех других символов. - Реализуйте проверки для пропуска уже обработанных слов и подумайте о реализации смещения X, которое проверяло бы, достаточно ли близка данная координата X к той, с которой вы проверяете, чтобы учесть слегка наклоненный вводимый текст.