#python #pandas
#python #pandas
Вопрос:
Я хочу прочитать файл csv и пытаюсь указать дату в качестве столбца индекса. Однако эта «статистика прибытия международных посетителей» не может быть удалена!!! Как мне удалить этот раздражающий заголовок? Я понятия не имею, как он туда попал и как его удалить.
import pandas as pd
import datetime
data5 = pd.read_csv('visitor.csv', parse_dates = [0], index_col=[0])
#data5 = data5.drop([0,1,2], axis = 0) # delete rows with irrelevant data
data5.columns = data5.iloc[3] # set the new header row with the proper header
data5 = data5[4:7768] # Take remaining data less the irrelevant data and the header row
data5
Комментарии:
1. Если возможно, удалите его из Excel перед загрузкой
2. Вы не можете просто перейти
skiprows=4
к своемуread_csv
?
Ответ №1:
Попробуйте использовать параметр header в pd.read_csv, который задает строку, которую вы хотите использовать в качестве заголовка в вашем df, поэтому для вас вы хотели бы использовать 5-ю строку, поэтому вы бы установили header = 4 следующим образом:
data5 = pd.read_csv('visitor.csv', parse_dates = [0], index_col=[0], header=4)