Обнаружение текста Google Cloud Vision — Игнорирование текста на логотипах

# #node.js #ocr #google-cloud-vision

Вопрос:

Я использую следующий код для обнаружения текста на изображении, а затем получаю этот результат в виде массива строк:

 const [result] = await googleapis.textDetection(attachment.url);
const texts = result.fullTextAnnotation;
const parsedText = texts.text.split('n');
 

Тем не менее, мое изображение содержит в основном текст, но иногда может включать и различные логотипы. Я знаю, что в Google Cloud Vision есть api для обнаружения логотипов, поэтому мне интересно, можно ли обнаружить логотипы, а затем «удалить их», прежде чем выполнять обнаружение текста. Или, по сути, игнорируйте их при обнаружении текста.

Комментарии:

1. Это может работать так, как вы сказали: использовать обнаружение логотипа, чтобы захватить логотип, а затем использовать функцию для стирания текста при обнаружении текста, но это также может быть ужасно, если у вас есть текст, который совпадает с логотипом, который вам нужен в документе. Другой возможный способ-использовать AutoML[1] для обучения модели, в которой эти логотипы не будут обнаружены. [1] cloud.google.com/vision/automl/docs