Удалите этот столбец заголовка из Python. Понятия не имею, откуда он взялся

#python #pandas

#python #pandas

Вопрос:

Я хочу прочитать файл csv и пытаюсь указать дату в качестве столбца индекса. Однако эта «статистика прибытия международных посетителей» не может быть удалена!!! Как мне удалить этот раздражающий заголовок? Я понятия не имею, как он туда попал и как его удалить.

 import pandas as pd
import datetime

data5 = pd.read_csv('visitor.csv', parse_dates = [0], index_col=[0])

#data5 = data5.drop([0,1,2], axis = 0) # delete rows with irrelevant data
data5.columns = data5.iloc[3] # set the new header row with the proper header 
data5 = data5[4:7768] # Take remaining data less the irrelevant data and the header row

data5
  

мой вывод

Исходный файл Excel

Комментарии:

1. Если возможно, удалите его из Excel перед загрузкой

2. Вы не можете просто перейти skiprows=4 к своему read_csv ?

Ответ №1:

Попробуйте использовать параметр header в pd.read_csv, который задает строку, которую вы хотите использовать в качестве заголовка в вашем df, поэтому для вас вы хотели бы использовать 5-ю строку, поэтому вы бы установили header = 4 следующим образом:

 data5 = pd.read_csv('visitor.csv', parse_dates = [0], index_col=[0], header=4)