#r #dplyr #statistics
Вопрос:
dfErbB <- read.csv(file.choose(), header=TRUE)
dfErbB$geneid <- substring(dfErbB$geneid, 1,18)original_gene_list <- dfErbB$log2FoldChange
Я исключил код здесь, потому что он содержит более 114 строк генов, но вот пример:
dfErbB <- filter(dfErbB, geneid == "ENSMUSG00000026842"
| geneid == "ENSMUSG00000026596")
names(original_gene_list) <- dfErbB$geneid
gene_list <- na.omit(original_gene_list)
gene_list = sort(gene_list, decreasing = TRUE)
gse <- gseGO(geneList=gene_list,
ont ="ALL",
keyType = "ENSEMBL",
nPerm = 10000,
minGSSize = 3,
maxGSSize = 800,
pvalueCutoff = 0.05,
verbose = TRUE,
OrgDb = org.Mm.eg.db,
pAdjustMethod = "BH")
Данные представляют собой файл res из DESeq2. Я получил эту ошибку и не знаю, как это исправить. Есть какие-нибудь предложения?
Ошибка в FUN(X[[i]], …) : статистика GSEA не определена, когда выбраны все гены