Попытка сделать прогноз для файла csv с использованием данных из другого

#python

#python

Вопрос:

Я следовал нескольким руководствам, но продолжаю получать ту же ошибку. Я больше не знаю, что делать. Я пытаюсь использовать данные в HealthScores для информирования файла Population о том, как оценивать показатели здоровья людей. Я был бы признателен за помощь в исправлении ошибок, которые я получаю: ни один из [Index([‘Показатель работоспособности (высокий — это хорошо)’], dtype=’object’)] не находится в [столбцах] «

 hs = pd.read_csv('HealthScores.csv')
pop = pd.read_csv('Population.csv')

pop['Health Score(high is good)'] = hs[['Health Score(high is good)']].shift(-predicted_Hscore)

hs_train, hs_test, pop_train, pop_test = train_test_split(hs, pop, test_size = 0.25)

#tree 

tree = DecisionTreeRegressor().fit(hs_train, pop_train)

#linear regression

lr =LinearRegression().fit(hs_train,pop_train)

pred_Score = hs.drop(['Health Score(high is good)'], 1)[:-predicted_Hscore]

pred_Score = pred_Score.tail(predicted_Hscore)

pred_Score = np.array(pred_Score)

pred_Score

tree_prediction = tree.predict(pred_Score)
print(tree_prediction)

lr_prediction = lr.predict(pred_Score)
print (lr_prediction)
  

Комментарии:

1. 1. Пожалуйста, используйте обратные метки для вставки блоков кода, а не одинарных кавычек. 2. Пожалуйста, укажите дополнительную информацию о том, чего вы пытаетесь достичь, и, возможно, даже ошибка, которую вы получаете, может помочь?

2. о, извините. мой плохой

3. Согласно вашей ошибке 'Health Score(high is good)' , это не столбец ни в pop одном, ни hs в другом. Вы можете распечатать столбцы с pop.columns помощью .

4. но это невозможно, потому что я уже использовал этот столбец для создания различных диаграмм. Столбец там наверняка есть. Я только что проверил, и это действительно так

5. Вы напечатали столбцы, как сказал @ygorg? Например, print(pop.columns) . То же самое для hs .