#python #pandas
#python #pandas
Вопрос:
Я импортировал набор данных HousePrices из Kaggle, отобразил строки в начале, но при вызове df.columns
я получаю только следующий вывод:
Вызов df.colums
:
houseprices.columns
вывод:
Index(['sep=', 'Unnamed: 1'], dtype='object')
Я не имею ни малейшего представления о том, что происходит, поэтому я был бы благодарен за объяснение и как это исправить.
Ответ №1:
Вам нужно указать pd.read_csv
, содержит ли фрейм данных имена столбцов. Поскольку вы этого не сделали, столбцы являются первой строкой вашего фрейма данных. Вот почему при использовании вы .head()
получаете 5 первых строк, из которых первая — это имена столбцов.
Попробуйте это:
houseprices = pd.read_csv('.\trains.csv', sep=',', header=0)
Прочитайте полную документацию здесь: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
Комментарии:
1. К вашему сведению, так и должно быть
header = 1
(в противном случае, согласно документам, поведение по умолчаниюheader = 0
, и они получат те же результаты)