Требуется помощь в удалении столбца из текстового файла с помощью ADF

ProgramBox

Требуется помощь в удалении столбца из текстового файла с помощью ADF

Post author:admin
Запись опубликована:9 января, 2022
Post category:Вопросы по программированию

#azure-data-factory

Вопрос:

У меня есть такой пример файла . Используя фабрику данных, где мне нужно создать еще один текстовый файл с выводом, где я могу удалить первые два столбца. Есть ли какой-либо запрос, по которому я могу сгенерировать файл, как показано ниже.

Исходный файл:

Выходной файл :

1. Поток данных — правильный инструмент для этого. После загрузки источника используйте SELECT, чтобы захватить только нужные столбцы, затем ПРИЕМНИК выведет только выбранные столбцы.

Ответ №1:

Основная фабрика данных (т. Е. Не включая Отображение потоков данных) не обладает многими способностями для преобразования данных (что и есть), однако она может делать некоторые вещи. Он может изменять форматы (например, csv в JSON), добавлять некоторые столбцы метаданных (например, имя файла$$) и удалять столбцы, просто используя сопоставление в операции копирования.

Добавьте действие копирования в свой конвейер и установите источник в свой основной файл
Установите приемник на имя вашего целевого файла. Это может быть то же имя, что и у вашего исходного файла, но я бы сделал его другим для целей аудита.
Импортируйте схему вашего файла, убедитесь, что разделитель в наборе данных установлен в точку с запятой ‘;’

4. Теперь нажмите кнопку Корзины, чтобы удалить сопоставления для столбцов 1 и 2. 5. Запустите конвейер. В выходном файле не должно быть двух столбцов.

Мои результаты:

Ответ №2:

Эту задачу можно выполнить с помощью преобразования Select в сопоставлении потока данных в фабрике данных Azure (ADF). Вы можете удалить все ненужные столбцы из текстового файла с разделителями в процессе преобразования потока данных.

Я протестировал то же самое в своей среде, и это работает нормально.

Пожалуйста, выполните следующие действия:

Создайте фабрику данных Azure с помощью портала Azure
Загрузите данные в источник (например, контейнер больших двоичных объектов)
Создайте связанную службу для подключения хранилища больших двоичных объектов к ADF, как показано ниже

Затем создайте наборы данных с разделителями текста, используя вышеупомянутую связанную службу для исходных и приемных файлов. В исходном наборе данных отметьте разделитель столбцов точкой с запятой(;). Кроме того, на вкладке Схема выберите Импортировать Схему из подключения/хранилища.

Создайте поток данных. Выберите исходный набор данных из списка наборов данных. Нажмите на символ , чтобы добавить параметры выбора, как показано ниже.

**В настройках выберите столбцы, которые вы хотите удалить, а затем нажмите на опцию удалить.

Добавьте раковину в конце. На вкладке Приемник используйте набор данных приемника, созданный ранее на шаге 4. На вкладке «Настройки» для параметра «Имя файла» выберите «Вывод в один файл» и укажите имя файла в опции ниже.

Теперь создайте конвейер и используйте действие потока данных. Выберите созданный поток данных. Нажмите кнопку Запустить сейчас, чтобы запустить конвейер.

Проверьте выходной файл в расположении приемника. Вы можете увидеть мои входные и выходные файлы ниже.

Метки: Требуется помощь в удалении столбца из текстового файла с помощью ADF