Ошибка в kmeans(набор данных, k) : больше центров кластера, чем отдельных точек данных, неиспользуемый аргумент (заголовок = FALSE), R

#r #cluster-computing

Вопрос:

Я пытаюсь применить модель psf для прогнозирования следующего значения в последовательности значений (см. Фрейм данных ниже). Я продолжаю получать ту же ошибку:

 data_rel_1 <- structure(list(job1category = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1), job2category = c(2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 1, 1, 1), job3category = c(2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 
1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 1, 1, 2, 1, 2, 2, 
1, 1, 1, 1, 1), job4category = c(1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 
2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 
2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 
2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 
2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2, 2, 
2, 1, 0, 2, 2)), class = c("spec_tbl_df", "tbl_df", "tbl", "data.frame"
), row.names = c(NA, -99L), spec = structure(list(cols = list(
    job1category = structure(list(), class = c("collector_double", 
    "collector")), job2category = structure(list(), class = c("collector_double", 
    "collector")), job3category = structure(list(), class = c("collector_double", 
    "collector")), job4category = structure(list(), class = c("collector_double", 
    "collector"))), default = structure(list(), class = c("collector_guess", 
"collector")), skip = 1L), class = "col_spec"))
 
 model1 <- psf(data_rel_1)
Error in kmeans(dataset, k) : more cluster centers than distinct data points.

 

Я попытался добавить заголовок = FALSE в read_csv, но это приводит к следующей ошибке:

 unused argument (header = FALSE)
 

У кого-нибудь есть опыт в этом или кто-нибудь знает, как я могу это решить?
Спасибо!!!

Комментарии:

1. Эй, откуда берется эта psf() функция (из какого пакета?)

2. @elielink Пакет PSF в R