Блоки данных или функции с ADF?

#azure #azure-functions #azure-data-factory #azure-databricks

#azure #azure-функции #azure-фабрика данных #azure-блоки данных

Вопрос:

Я использую ADF для вывода некоторых отчетов в формате PDF (по крайней мере, это цель.)

Я использую ADF для вывода CSV в большой двоичный объект хранилища, и я хотел бы использовать это, выполнить некоторую работу с форматированием и статистикой (с scipy и matplotlib на python) и экспортировать в формате PDF в тот же контейнер. Это будет выполняться раз в месяц, и я могу выполнять несколько других подобных действий, но это самое большее периодические отчеты, без потоковой передачи или чего-то подобного.

С архитектурной точки зрения, было бы это хорошим приложением для функции Azure (в которой у меня есть некоторый опыт) или Azure Databricks (в которой мне понадобится некоторый опыт).).

Моя первая мысль — это функции Azure, поскольку они бессерверные и платные по мере использования. Но я не слишком много знаю о Databricks, за исключением того, что он в основном используется для больших данных и длительных заданий.

Комментарии:

1. Полностью согласен с ответом, используйте функцию Azure

Ответ №1:

Блоки данных почти наверняка были бы излишними для этого. Так что да, функция Azure для Python идеально подходит для вашего сценария.