Как настроить данные для «ranger» в R. Ошибка: отсутствуют данные в столбцах

#r #missing-data #r-ranger

#r #отсутствует-данные #r-ranger

Вопрос:

Код:

 ranger(outcome~., data, num.trees=500, probability=TRUE)
  

Ошибка: отсутствуют данные в столбцах

Существует ли формат, в котором должны быть данные? Как обойти эту ошибку?

Комментарии:

1. Добро пожаловать в Stack Overflow. Чтобы правильно ответить на ваш вопрос, людям нужно будет посмотреть, как выглядят ваши данные.

Ответ №1:

Вам необходимо удалить пример NAs:

 ranger(outcome~., data[complete.cases(data),], num.trees=500, probability=TRUE)
  

Другие методы используют пакеты типа mice или miceFast для вменения (заполнить NA).
Другое простое решение для вменения данных случайными данными (из каждого столбца).

 data_cs = data.frame(Map(function(x) Hmisc::impute(x,'random'), data))
ranger(outcome~., data_cs, num.trees=500, probability=TRUE)