Изменение координат ограничивающей рамки Amazon Textract для определенного блока

#coordinates #amazon-textract

#координаты #amazon-textract

Вопрос:

Я использую Amazon Textract для обнаружения текста или необработанного текста, форм и таблиц.

Для этого я загружаю PDF-файл.

Я использую координаты, чтобы получить значение из необработанного текста. Мне удалось получить значение. Но через несколько дней координаты ограничивающей рамки для этого конкретного блока изменились. Тогда моя логика не работала.

У вас, ребята, есть какие-либо идеи, почему эти координаты меняются?

Вот как я применил свою логику после определения координат.

 if ((item.Geometry.BoundingBox.Top >= 0.92379182 amp;amp; item.Geometry.BoundingBox.Top <= 0.96)
        amp;amp; (item.Geometry.BoundingBox.Left >= 0.02470588 amp;amp; item.Geometry.BoundingBox.Left <= 0.29)
        amp;amp; (item.Geometry.BoundingBox.Height >= 0.001 amp;amp; item.Geometry.BoundingBox.Height <= 0.054545)
        amp;amp; (item.Geometry.BoundingBox.Width >= 0.001 amp;amp; item.Geometry.BoundingBox.Width <= 0.16))
            {
                text = text   " "   item.Text;
            }
  

Ответ №1:

Модели машинного обучения, лежащие в основе Textract, могут быть изменены. Хотя существуют регрессионные тесты, гарантирующие, что общее качество не ухудшится, это не значит, что результаты никогда не изменятся. Особенно такие вещи, как ограничивающие рамки, до тех пор, пока область интересов по-прежнему ограничена правильно, незначительное изменение координат не может рассматриваться как регрессия.