#pandas #scikit-learn
#pandas #scikit-учиться
Вопрос:
Я могу распечатать p-значения моей регрессии, но я бы хотел, чтобы мой вывод содержал значение X2 в качестве ключа и p-значение рядом с ним.
Я хочу, чтобы результат выглядел следующим образом:
attr1_1: 3.73178531e-01
sinc1_1: 4.97942222e-06
код:
from sklearn.linear_model import LogisticRegression
from scipy import stats
X2 = dating[['attr1_1', 'sinc1_1', 'intel1_1', 'fun1_1', 'amb1_1', 'shar1_1', 'attr_o','sinc_o','intel_o','fun_o','amb_o','shar_o','age', 'race',]]
y = dating['match']
dating_log_model = LogisticRegression(solver='liblinear')
dating_log_model.fit(X2,y)
dating_log_model.score(X2,y)
# getting the p-values
from sklearn.feature_selection import chi2
scores, pvalues = chi2(X2, y)
print(pvalues)
# current output
[3.73178531e-01 4.97942222e-06 3.49411284e-02 1.14925100e-11
6.40544454e-02 7.46131800e-10 3.52640714e-58 1.31669842e-17
5.15620104e-15 1.42543106e-62 6.60005884e-15 1.52260795e-81
7.41356400e-02 8.19087227e-01]
Ответ №1:
попробуйте это вместо того, чтобы напрямую печатать pvalues
com_dic = {'X2':X2.columns, 'pvalues':pvalues}
result = pd.DataFrame(com_dic)
print(result)