Проблема T-test «KeyError» с файлом CSV в статистических тестах Python

#python #pandas #dataframe #testing

#python #pandas #фрейм данных #тестирование

Вопрос:

Мой код приведен ниже (взят непосредственно у моего профессора с измененными именами):

 from scipy.stats import ttest_ind

group1 = df1['pref_foot'] == 'Right'
group2 = df1['pref_foot'] == 'Left'

print ('var1 %0.3f var2 %0.3f' % (df1['FIFAdata'][group1].var(), df1['FIFAdata'][group2].var()))
t, pvalue = ttest_ind(df1['FIFAdata'][group1], df1['FIFAdata'][group2], axis=0, equal_var=False)
print ('t statistic %0.3f p-value %0.3f' % (t, pvalue))
  

Выше у меня есть следующий код:

 import pandas as pd
import numpy as np
df1 = pd.read_csv('FIFAdata.csv')
df1.head()
  

Когда я запускаю его, он выдает ошибку — KeyError: 'FIFAdata'

Я проверял это несколько раз и не могу понять, почему ему не нравится файл CSV. Весь мой другой код с этим файлом работает корректно.

Комментарии:

1. Данные взяты из kaggle.com/stefanoleone992/fifa-19-fifa-ultimate-team/version/7 изменен заголовок файла CSV

2.Проверьте свой df1.columns . Вы должны найти именно FIFAdata там. Проверьте наличие дополнительных пробелов до и после фактической FIFAdata строки.

3. Есть ли у вас столбец с именем ‘FIFAdata’?