Как удалить несколько строк заголовка из панд фреймов данных

#pandas

Вопрос:

У меня есть 4 файла csv с тем же форматом и строкой заголовка, что и первая строка в каждом файле. Я объединил их в фрейм данных, используя приведенный ниже код:

 df = pd.concat(map(pd.read_csv, [file for file in glob.glob('data/*.csv')]))

Теперь я понимаю, что заголовки из каждого файла будут содержаться в данных и вызовут проблемы при анализе. Есть ли способ удалить все заголовки, кроме первого?

Ответ №1:

Тебе это нужно?

 df = (
    pd.concat(
        (pd.read_csv(file)
         if index == 0
         else
         pd.read_csv(file).iloc[1:]
         for index, file in enumerate(glob.glob('data/*.csv')))
    )
)

1. Я вижу логику в вашем коде. Довольно хорошо, и спасибо, что поделились этим. Однако это дало мне такое же количество строк, как и мой код. Означает ли это, что мой код также удалил заголовки после первого файла?

2. @l4tech можете ли вы поделиться 2/3 образцами CSV всего по несколько строк в каждом?

Вопрос:

Ответ №1:

Комментарии:

Вам также может понравиться

Треугольный импульс с преобразованием Фурье

Удаление специальных символов и подстрок из строк в столбце

почему gdb не загружает libdl через sharedlibrady? и heaptrack не работает