#r
Вопрос:
Существует ли аргумент под функцией cforest в R, который может заставить ее изучить наименее распространенное наблюдение?
Я пытаюсь сделать прогноз оценки между 1-5. В моих тренировочных данных у меня много наблюдений между 2-4, а некоторые-1 или 5. Случайный лес предсказывает только 2-4, хотя я знаю, что также должны быть предсказания, которые равны 1 и 5.
Спасибо!
Комментарии:
1. Если
1
и5
встречаются редко в рамках обучающего набора, существует в целом небольшая априорная вероятность того, что результат будет1
или5
. Может быть, лес прав, никогда не предсказывая их с самого начала? Вы можете рассмотреть возможность1
чрезмерного представления и5
случаев в наборе обучения, поместив их дважды или n раз в набор обучения, если это необходимо, чтобы они иногда предсказывались.2. в функции cforest нет аргумента, который каким-то образом мог бы это сделать?
3. Вы читали описание функции? rdocumentation.org/packages/partykit/versions/1.2-13/topics/… Есть один аргумент
weights
. Я предполагаю, что это могло бы помочь придать больший вес наблюдениям, ведущим к1
и.5
Минимальный воспроизводимый пример может убедить пользователей ответить кодом.