#cross-validation #maxent
#перекрестная проверка #maxent
Вопрос:
Привет, я использую программное обеспечение Maxent 3.4.0 для Mac и пытаюсь понять проблему k-кратной перекрестной проверки.
В принципе, я понял, что мой набор данных разбит на k сгибов, и каждый сгиб более или менее одинакового размера. Поэтому, если в моем наборе данных 100 наблюдений, 10-кратная перекрестная проверка разделит набор данных на 10 сгибов по 10 наблюдений, и Maxent обучит 10 моделей, каждая с 9 сгибами, а 10-я проверит ее.
Мой вопрос: могу ли я разделить свой набор данных более чем на 10 сгибов (например, 50 сгибов), НО с 10 наблюдениями на сгиб? В этом случае, конечно, вхождения будут использоваться не один раз, а столько раз, сколько они появляются в разных сгибах.
Могу ли я это сделать (без командной строки, что я не знаю, как ее использовать)? Может ли результат иметь смысл?
Ответ №1:
Смысл перекрестной проверки заключается в том, что каждая итерация вашей модели проверяется на наблюдениях, по которым она не была откалибрована. В вашем примере неизбежно, что ваши проверочные сгибы будут содержать наблюдения, используемые при калибровке модели, что приведет к увеличению AUC перекрестной проверки.
На что вы могли бы обратить внимание, так это на использование опции начальной загрузки в Maxent. К вашему сведению, вопрос о перекрестной проверке и начальной загрузке с помощью Maxent был задан ранее здесь https://gis.stackexchange.com/questions/366513/difference-between-bootstrap-and-cross-validation-maxent
Комментарии:
1. Извините за поздний ответ, Лиам, спасибо за ссылку, которая была очень полезной