#pandas
Вопрос:
У меня есть 4 файла csv с тем же форматом и строкой заголовка, что и первая строка в каждом файле. Я объединил их в фрейм данных, используя приведенный ниже код:
df = pd.concat(map(pd.read_csv, [file for file in glob.glob('data/*.csv')]))
Теперь я понимаю, что заголовки из каждого файла будут содержаться в данных и вызовут проблемы при анализе. Есть ли способ удалить все заголовки, кроме первого?
Ответ №1:
Тебе это нужно?
df = (
pd.concat(
(pd.read_csv(file)
if index == 0
else
pd.read_csv(file).iloc[1:]
for index, file in enumerate(glob.glob('data/*.csv')))
)
)
Комментарии:
1. Я вижу логику в вашем коде. Довольно хорошо, и спасибо, что поделились этим. Однако это дало мне такое же количество строк, как и мой код. Означает ли это, что мой код также удалил заголовки после первого файла?
2. @l4tech можете ли вы поделиться 2/3 образцами CSV всего по несколько строк в каждом?