Снежинка. Массовое обновление обработки строк / микропартий

#snowflake-cloud-data-platform

#снежинка-облачная платформа данных

Вопрос:

Когда вы выполняете массовое обновление (например, операцию слияния), если в одной и той же операции слияния обновляются несколько строк одного и того же микрораздела, я предполагаю, что Snowflake в фоновом режиме «сгруппирует» все эти обновления этого микрораздела и сгенерирует только один новый файл микропартиции из исходного, а не столько , сколько обновлено строк ?

Заранее спасибо

Комментарии:

1. Интересно… почему вы так думаете?

2. Snowflake считывает все микропартии, содержащие данные, которые необходимо обновить, изменяет данные, которые необходимо изменить, а затем генерирует новые микропартии таким же образом, как если бы вы вставляли данные в первый раз. Создание новых микропартий таким образом очень эффективно, поскольку несколько потоков выполняют создание микропартий в зависимости от размера используемого хранилища. Не совсем уверен, что я понимаю, в чем ваш вопрос здесь? Зачем вам микропартия для каждой обновленной строки?