#r #model #random-forest
Вопрос:
У меня есть большой фрейм данных, и два столбца, которые теперь являются классом символов, заполнены значениями true и false:
customer_has_profile customer_has_picture t f t f f t t f f t t t t f
Я использую случайный лес для прогнозирования переменных во фрейме данных, но я не уверен, как добавить эти две переменные в модель случайного леса. Должен ли я преобразовать эти два класса символов в фактор или логическое значение? К какому типу класса(факторному или логическому) мне следует преобразовать эти две символьные переменные? (Примечание: Я просто хочу использовать случайный лес для прогнозирования) Заранее спасибо!!!
Комментарии:
1. Преобразуйте их в логические с помощью чего-то вроде
mydf$myvar lt;- ifelse(mydf$myvar == "t", TRUE, FALSE)
. R трактует TRUE как 1, а FALSE как 0, когда логическая переменная используется в статистических или математических целях.