функция леса в R

#r

Вопрос:

Существует ли аргумент под функцией cforest в R, который может заставить ее изучить наименее распространенное наблюдение?

Я пытаюсь сделать прогноз оценки между 1-5. В моих тренировочных данных у меня много наблюдений между 2-4, а некоторые-1 или 5. Случайный лес предсказывает только 2-4, хотя я знаю, что также должны быть предсказания, которые равны 1 и 5.

Спасибо!

Комментарии:

1. Если 1 и 5 встречаются редко в рамках обучающего набора, существует в целом небольшая априорная вероятность того, что результат будет 1 или 5 . Может быть, лес прав, никогда не предсказывая их с самого начала? Вы можете рассмотреть возможность 1 чрезмерного представления и 5 случаев в наборе обучения, поместив их дважды или n раз в набор обучения, если это необходимо, чтобы они иногда предсказывались.

2. в функции cforest нет аргумента, который каким-то образом мог бы это сделать?

3. Вы читали описание функции? rdocumentation.org/packages/partykit/versions/1.2-13/topics/… Есть один аргумент weights . Я предполагаю, что это могло бы помочь придать больший вес наблюдениям, ведущим к 1 и. 5 Минимальный воспроизводимый пример может убедить пользователей ответить кодом.