Перекрестная вкладка и тест Хи-квадрат в Python

#python

#python

Вопрос:

Я пытаюсь выучить python.

У меня есть таблица с предпочтениями пользователей (A или B

     Preference
0      A
1      A
2      B
3      A
4      B
  

Я хотел создать таблицу перекрестных вкладок, а затем выполнить тест Хи-квадрат

Итак, таблица перекрестных вкладок

 A   number of A's
B   number of B's
  

а затем тест хи-квадрат, дающий значение pvalue и степени свободы

Я знаю, как это сделать в R

 tbl= xtabs( ~ Preference, data=df)
chisq.test(tbl)
  

Но не могу понять, как это сделать на Python, хотя это кажется довольно простым.

Кто-нибудь может помочь?

Ответ №1:

Для создания перекрестных таблиц

вы можете использовать pd.crosstab(df.index,df.preferences)

для теста хи-квадрат используйте модуль scipy в качестве поддержки

 from scipy.stats import chi2_contingency

stat, p, dof, expected = chi2_contingency(df)