Цвет в биплотном принце и биплоте

#r #iris-dataset

Вопрос:

как можно раскрасить виды набора данных радужной оболочки в двухплоскостях разными цветами, используя princomp и biplot. Лучшие

 data(iris)


fit <- princomp(iris[,c(1:3)], cor=TRUE)
biplot(fit)

 

Ответ №1:

Функция, используемая для визуализации биплота, stats:::biplot.princomp и stats:::biplot.default не допускает нескольких цветов или разных цветов для разных точек. Самое простое решение-использовать пакет, например ggfortify, как указано в другом ответе:

 library(ggfortify)
autoplot( fit, data=iris, colour="Species", loadings=TRUE )
 

введите описание изображения здесь

Или factoextra :

 library(factoextra)
fviz_pca_biplot(fit, col.ind = iris$Species)
 

введите описание изображения здесь

Последний вариант заключается в том, что вы переписываете функцию биплота, как показано ниже, с col1 использованием вектора цветов для точек данных и col2 цвета для нагрузок:

 biplot_col = function (x, y, var.axes = TRUE,col1,col2, cex = 0.8, 
    xlabs = NULL, ylabs = NULL, expand = 1, xlim = NULL, ylim = NULL, 
    arrow.len = 0.1, main = NULL, sub = NULL, xlab = NULL, ylab = NULL, 
    ...) 
{
    n <- nrow(x)
    p <- nrow(y)
    xlabs <- as.character(1L:n)
    dimnames(x) <- list(xlabs, dimnames(x)[[2L]])
    ylabs <- dimnames(y)[[1L]]
    ylabs <- as.character(ylabs)
    dimnames(y) <- list(ylabs, dimnames(y)[[2L]])
    
    unsigned.range <- function(x) c(-abs(min(x, na.rm = TRUE)), 
        abs(max(x, na.rm = TRUE)))
    rangx1 <- unsigned.range(x[, 1L])
    rangx2 <- unsigned.range(x[, 2L])
    rangy1 <- unsigned.range(y[, 1L])
    rangy2 <- unsigned.range(y[, 2L])
    if (missing(xlim) amp;amp; missing(ylim)) 
        xlim <- ylim <- rangx1 <- rangx2 <- range(rangx1, rangx2)
    else if (missing(xlim)) 
        xlim <- rangx1
    else if (missing(ylim)) 
        ylim <- rangx2
    ratio <- max(rangy1/rangx1, rangy2/rangx2)/expand
    on.exit(par(op))
    op <- par(pty = "s")
    if (!is.null(main)) 
        op <- c(op, par(mar = par("mar")   c(0, 0, 1, 0)))
    plot(x, type = "n", xlim = xlim, ylim = ylim, col = col1, 
        xlab = xlab, ylab = ylab, sub = sub, main = main, ...)
    text(x, xlabs, cex = cex[1L], col = col1, ...)
    par(new = TRUE)
    dev.hold()
    on.exit(dev.flush(), add = TRUE)
    plot(y, axes = FALSE, type = "n", xlim = xlim * ratio, ylim = ylim * 
        ratio, xlab = "", ylab = "", col = col1, ...)
    axis(3, col = col2, ...)
    axis(4, col = col2, ...)
    box(col = col1)
    text(y, labels = ylabs, cex = cex[2L], col = col2, ...)
    if (var.axes) 
        arrows(0, 0, y[, 1L] * 0.8, y[, 2L] * 0.8, col = col2, 
            length = arrow.len)
    invisible()
}
 

Затем постройте такой сюжет:

 lam <- fit$sdev[1:2]
lam <- lam * sqrt(fit$n.obs)
scores <- fit$scores
species2col = c("#c15050","#d97642","#d49d42")
names(species2col) = unique(iris$Species)
col1 = species2col[as.character(iris$Species)]
col2 = "#693c72"

par(mar=rep(2.2,4))
biplot_col(t(t(scores[,1:2])/lam), t(t(fit$loadings[,1:2]) * lam),
           col1 = col1, col2 = col2)
 

введите описание изображения здесь

Ответ №2:

К сожалению, он этого не поддерживает. Вам придется написать свою собственную функцию биплота и добавить возможность придания ей разных цветов для каждого образца, источник довольно широк.

https://github.com/SurajGupta/r-source/blob/master/src/library/stats/R/biplot.R

В качестве альтернативы используйте более модную функцию, например автозапуск

 autoplot( fit, data=iris, colour="Species", loadings=TRUE )
 

Как показано здесь:

https://cran.r-project.org/web/packages/ggfortify/vignettes/plot_pca.html