Функция Ind для KNN

#r #knn

#r #knn

Вопрос:

это мой первый контакт с R (или любым другим языком), и я пытаюсь понять эти строки для проекта KNN:

 #Data partition
ind <- sample(2, nrow(data), replace = T, prob (0.7, 0.3))

training <- data [ind == 1,]

test <- data [ind == 2,]
  

Первая строка сообщает мне, что будет создан один образец, который содержит значения (1 или 2) с заменой и составляет 70% от моего размера данных, а другой — 30%, верно?

Если да, то в чем смысл значения ind == 1 в моем обучающем объекте или ind == 2 в моем тестовом объекте?

Комментарии:

1. Error in prob(0.7, 0.3) : could not find function "prob" . Пожалуйста, добавьте, какие пакеты вы используете.

2. вы будете использовать ind для извлечения исходного значения из из data при каждом разделении.