Фабрика данных Azure — загрузка журналов Application Insights в Data Lake Gen 2

#azure-data-factory-2 #azure-data-lake-gen2

#azure-data-factory-2 #azure-data-lake-gen2

Вопрос:

У меня Application Insights настроен период хранения журналов в три месяца, и я хочу загружать их с помощью конвейеров фабрики данных, запланированных ежедневно, в хранилище Data Lake Gen 2. Цель этого — не потерять данные по истечении срока хранения и сохранить данные для будущих целей — в основном для машинного обучения и создания отчетов.

Я пытаюсь решить, какой формат использовать для хранения этих данных, из множества форматов, доступных в Data Lake Gen 2, поэтому, если у кого-то есть похожий дизайн, любая информация или ссылки на документацию будут более ценными.

Ответ №1:

По моему опыту, большинство файлов журналов .log имеют формат файлов. Если мы хотим сохранить тип файла и переместить их в Data Lake Gen 2, пожалуйста, используйте двоичный формат. введите описание изображения здесь

Двоичный формат может помочь вам переместить всю папку / подпапку и все файлы в другое место назначения.

HTH.

Комментарии:

1. Спасибо, Леон, но App Insights возвращает файл JSON. На данный момент я загружаю данные App Insights в виде ежедневных файлов JSON в структуре {AppInsights_Container} {entity} {year} {Month} {entity}_{гггг_мм_дд}.JSON, куда файлы JSON экспортируются ежедневно. Я все еще открыт для лучших способов сделать это — Data Lake Gen 2 обладает множеством функций, поэтому я думаю, что легко упустить лучший вариант реализации.

2. @Maus, я понял. Поскольку App Insights возвращает файл JSON, формат JSON является первым выбором. Но использование двоичного формата может помочь вам переместить всю папку / подпапку и все файлы в озеро данных Gen 2. Я думаю, ключ в том, что может сделать Data Factory, а не в функции Data Lake Gen 2

3. Привет @ Maus, у вас есть какие-либо другие проблемы?