Преобразование и визуализация матрицы подобия в R

#r #matrix #visualization #similarity

#r #матрица #визуализация #подобие

Вопрос:

Я работаю с матрицей, которая содержит несколько записей и их подобие в следующем формате:

 //      A      B      C  

 A      1     0.8    0.4

 B      0.8    1     0.2

 C      0.4   0.2     1
  

В этом случае 1 означает, что две записи идентичны, 0 — что они совершенно разные. Каждая запись представляет одну строку наблюдений, которые либо присутствуют, либо отсутствуют. Значение подобия вычисляется путем проверки на совпадающие наблюдения. Я хотел бы визуализировать это отношение разных записей; можно ли в этом случае использовать дендрограмму?

Комментарии:

1. Спасибо за ваше предложение! Это отлично помогает выявлять сходства и различия. Была бы какая-либо возможность показать «взаимосвязи» между различными записями в виде такой дендрограммы, которая группирует разные записи по их сходству?

Ответ №1:

Вот два способа визуализации вашей матрицы.

  1. corrplot

    библиотека (corrplot)
    corrplot(Mat)

corrplot

  1. дендрограмма с использованием hclust

Ваша матрица похожа, но для hclust нам нужно это сходство, поэтому я преобразоваю ее с помощью 1 — Mat.

 HC = hclust(as.dist(1-Mat))
plot(HC)
  

Дендрограмма

Комментарии:

1. Большое спасибо за вашу помощь!