как запустить пакет prefixspan (sparklyr) (последовательный анализ шаблонов)

#r #apache-spark #sparklyr

Вопрос:

Может кто-нибудь показать, как преобразовать данные ( list ) для запуска ml_prefixspan алгоритма Я не нашел реальных примеров для sparklyr пакета ни в виньетке, ни в Интернете.

 # make fake data
li <- list()
for(i in 1:10){
  some.items <- make.unique(as.character(round(rnorm(sample(10:30,1)),2)))
  some.items[sort(sample(1:length(some.items),5))] <- 1:5  # some significant sequence  "1,2,3,4,5"
  li[[i]] <- some.items
}

 
 

что нужно сделать, чтобы запустить ml_prefixspan?

 library(sparklyr)
model <- ml_prefixspan(li,seq_col = "sequence",
                       min_support = 0.1,
                       max_pattern_length = 10)