#r #random-forest
#r #случайный лес
Вопрос:
Я пытаюсь обучить свой набор данных, используя R. Ниже приведен код, который я буду использовать
functionRankFeatureByImportance <- function(logwine_withoutQuality){
#logwine_withoutQuality$quality<-factor(logwine_withoutQuality$quality)
# ensure results are repeatable
set.seed(7)
# prepare training scheme
control <- trainControl(method="repeatedcv", number=10, repeats=3)
# train the model
model <- train(logwine_withoutQuality[,-12],
logwine_withoutQuality$quality, method="lvq", preProcess="scale", trControl=control)
# estimate variable importance
importance <- varImp(model, scale=FALSE)
# summarize importance
print(importance)
# plot importance
plot(importance)
}
Но при использовании этого я получаю сообщение об ошибке, как показано ниже.
Я не могу понять, в чем моя ошибка.
Ниже приведено изображение набора данных, который я использую
Во фрейме данных нет нулевых значений.
Очень признателен, если кто-нибудь любезно поможет мне решить эту проблему
Комментарии:
1. Пожалуйста, не предоставляйте свои данные в виде изображения. Никто не хочет вводить ее для тестирования кода. Кроме того, легко видеть, что ваше сообщение об ошибке больше, чем то, что вы показываете. Не могли бы вы показать все сообщение об ошибке? Просто предположение о вашей проблеме: похоже, вы взяли логарифмы набора данных о качестве вина. Я считаю, что это имеет некоторые нулевые значения, поэтому вы получите значения NA в своих данных, когда вы берете log (0). Это может вызвать проблемы здесь.
2. Привет, большое спасибо… Это была ошибка… Миллион благодарностей