Pentaho — пропустить 2 строки в CSV-файле перед заголовком

#pentaho #pentaho-spoon #pentaho-data-integration

#pentaho #pentaho-ложка #pentaho-интеграция данных

Вопрос:

У меня есть CSV-файл в следующей структуре :

 *name of the file*
*date amp; location*
header1   header2    header3
data1,    data2,     data3
  

У меня есть шаг ввода CSV, который считывает содержимое файла. Как я могу пропустить первые два файла в файле, чтобы прочитать заголовок из строки 3? На шаге ввода CSV, похоже, нет опции для этого.

Любая помощь приветствуется!

Комментарии:

1. проверьте Text file input шаг

2. @jxc Похоже, я также не могу найти опцию «пропускать строки» на шаге ввода текстового файла.

3. Content Вкладка -> Заголовок: Number of header lines = 3

4. jxc, запиши это как ответ, поскольку он правильный.

Ответ №1:

Возможно, это решение могло бы помочь кому-то другому. Чтобы пропустить строки из csv-файла, вы должны прочитать файл с помощью шага «Ввод текстового файла» и считать все ваши столбцы как один, используйте разделитель, которого нет в ваших данных, и тогда файлы не будут разделяться. Затем присвоите номера строк, используя шаг «Добавить последовательность». после этого вы можете использовать шаг «Фильтр», чтобы пропустить начальные строки. После удаления верхних строк разделите поля, используя шаг «Разделить файлы», и укажите имена столбцов.это изображение содержит привязку преобразования