Данные разделов при записи в дельта-приемник

#azure-synapse #data-partitioning #delta-index

Вопрос:

В потоке данных сопоставления Azure теперь у нас есть возможность сохранять файлы в формате дельта. Но это доступно только тогда, когда мы выбираем встроенный набор данных (без подписки на блоки данных). И когда набор данных приемника является встроенным набором данных, он не позволяет устанавливать раздел на основе какого-либо столбца.

Я могу написать код pyspark, чтобы переписать дельта-таблицу с требуемым разделом. Но это повлечет за собой дополнительные расходы.

Какие могут быть обходные пути для получения хорошей производительности при обработке дельта-данных?

Комментарии:

1. Пожалуйста, отредактируйте вопрос, чтобы ограничить его конкретной проблемой с достаточной детализацией для определения адекватного ответа.

Ответ №1:

Возникла проблема с пользовательским интерфейсом, которая недавно была исправлена командой инженеров. Пока это не отразится на вашем конце.

Вы можете сделать следующее в качестве обходного пути :

Вариант 1 :

Вы можете изменить тип приемника на что-то другое, например, приемник текста с разделителями, и затем вы должны увидеть ключевые столбцы в разделении ключей. Затем переключите тип раковины обратно на Delta.

Ссылка : https://docs.microsoft.com/en-us/answers/questions/599075/index.html

Вариант 2: Вы можете включить разделение на исходном конце.

введите описание изображения здесь

Секционированные данные текли как поток. В результате мне удалось получить секционированные данные