AWS для отслеживания обработанных данных в DocumentDB

#amazon-web-services #aws-glue #aws-documentdb

#amazon-веб-сервисы #aws-glue #aws-documentdb

Вопрос:

В качестве источника данных у меня есть DocumentDB.

Я запускаю задание склеивания AWS, которое извлекает все данные из определенной таблицы, а затем вставляет их в кластер RedShift.

Можно ли избежать добавления повторяющихся данных?

Я видел, что AWS glue поддерживает закладки,

Похоже, это не работает для DocumentDB в качестве источника данных

Спасибо.