#r #missing-data #r-ranger
#r #отсутствует-данные #r-ranger
Вопрос:
Код:
ranger(outcome~., data, num.trees=500, probability=TRUE)
Ошибка: отсутствуют данные в столбцах
Существует ли формат, в котором должны быть данные? Как обойти эту ошибку?
Комментарии:
1. Добро пожаловать в Stack Overflow. Чтобы правильно ответить на ваш вопрос, людям нужно будет посмотреть, как выглядят ваши данные.
Ответ №1:
Вам необходимо удалить пример NAs:
ranger(outcome~., data[complete.cases(data),], num.trees=500, probability=TRUE)
Другие методы используют пакеты типа mice
или miceFast
для вменения (заполнить NA).
Другое простое решение для вменения данных случайными данными (из каждого столбца).
data_cs = data.frame(Map(function(x) Hmisc::impute(x,'random'), data))
ranger(outcome~., data_cs, num.trees=500, probability=TRUE)