#r #matrix #visualization #similarity
#r #матрица #визуализация #подобие
Вопрос:
Я работаю с матрицей, которая содержит несколько записей и их подобие в следующем формате:
// A B C
A 1 0.8 0.4
B 0.8 1 0.2
C 0.4 0.2 1
В этом случае 1 означает, что две записи идентичны, 0 — что они совершенно разные. Каждая запись представляет одну строку наблюдений, которые либо присутствуют, либо отсутствуют. Значение подобия вычисляется путем проверки на совпадающие наблюдения. Я хотел бы визуализировать это отношение разных записей; можно ли в этом случае использовать дендрограмму?
Комментарии:
1. Спасибо за ваше предложение! Это отлично помогает выявлять сходства и различия. Была бы какая-либо возможность показать «взаимосвязи» между различными записями в виде такой дендрограммы, которая группирует разные записи по их сходству?
Ответ №1:
Вот два способа визуализации вашей матрицы.
-
corrplot
библиотека (corrplot)
corrplot(Mat)
- дендрограмма с использованием
hclust
Ваша матрица похожа, но для hclust
нам нужно это сходство, поэтому я преобразоваю ее с помощью 1 — Mat.
HC = hclust(as.dist(1-Mat))
plot(HC)
Комментарии:
1. Большое спасибо за вашу помощь!