Кластеризация диаграммы рассеяния в R

#r #cluster-analysis #k-means #scatter-plot #clustered-index

#r #кластерный анализ #k-означает #диаграмма рассеяния #кластеризованный индекс

Вопрос:

Я работаю с биномиальными данными (принадлежат двум классам). Вот как выглядят данные:

 df <-data.frame(matrix(runif(10*100), ncol=10)) 
group <- c(rep("A",50),rep("B",50))
df <- cbind(df,group)
plot(df$X1,df$X2,col=df$group)
  

Я знаю, что можно выполнить кластеризацию Kmeans для основных компонентов набора данных. Но я пытаюсь сгруппировать данные на основе двух переменных X1 и X2 и назначить найденный кластер каждой точке данных. Возможно ли это сделать?
Я доволен любым предложенным методом кластеризации.

Спасибо,

Ответ №1:

Вы можете просто поместить эти две переменные в kmeans :

 plot(df[,1:2],col=kmeans(df[,1:2],2)$cluster)