#statistics #chi-squared #hypothesis-test
Вопрос:
Я использую функцию chisq.test() для хорошей подгонки. Я запускаю тест с помощью ряда переменных и в некоторых случаях получаю следующее сообщение:
В тесте chisq. (TBL_all_f) : приближение Хи-квадрат может быть неправильным.
Значения моей переменной разбиты на 20 ячеек, и я считаю, что математически этот вывод означает, что количество наблюдений в некоторых ячейках невелико. В то же время это не относится ко всем моим переменным, и ради согласованности я хотел бы сохранить все ячейки. Мой вопрос в том, как я должен интерпретировать сообщение «может быть неверным»? Могу ли я предположить, что это означает, что квадрат X может быть завышен, а значение p занижено, так что я могу принять значение p в качестве консервативной оценки?