#r #cluster-analysis #k-means #scatter-plot #clustered-index
#r #кластерный анализ #k-означает #диаграмма рассеяния #кластеризованный индекс
Вопрос:
Я работаю с биномиальными данными (принадлежат двум классам). Вот как выглядят данные:
df <-data.frame(matrix(runif(10*100), ncol=10))
group <- c(rep("A",50),rep("B",50))
df <- cbind(df,group)
plot(df$X1,df$X2,col=df$group)
Я знаю, что можно выполнить кластеризацию Kmeans для основных компонентов набора данных. Но я пытаюсь сгруппировать данные на основе двух переменных X1 и X2 и назначить найденный кластер каждой точке данных. Возможно ли это сделать?
Я доволен любым предложенным методом кластеризации.
Спасибо,
Ответ №1:
Вы можете просто поместить эти две переменные в kmeans
:
plot(df[,1:2],col=kmeans(df[,1:2],2)$cluster)