#r #knn
#r #knn
Вопрос:
это мой первый контакт с R (или любым другим языком), и я пытаюсь понять эти строки для проекта KNN:
#Data partition
ind <- sample(2, nrow(data), replace = T, prob (0.7, 0.3))
training <- data [ind == 1,]
test <- data [ind == 2,]
Первая строка сообщает мне, что будет создан один образец, который содержит значения (1 или 2) с заменой и составляет 70% от моего размера данных, а другой — 30%, верно?
Если да, то в чем смысл значения ind == 1 в моем обучающем объекте или ind == 2 в моем тестовом объекте?
Комментарии:
1.
Error in prob(0.7, 0.3) : could not find function "prob"
. Пожалуйста, добавьте, какие пакеты вы используете.2. вы будете использовать
ind
для извлечения исходного значения из изdata
при каждом разделении.