Интерпретация выходных данных терминов R bioconductor GO

#r #bioconductor

#r #bioconductor

Вопрос:

Я пытаюсь получить предковый термин go из списка терминов go. Я использовал bioconductor в R для этой задачи. Но я совершенно сбит с толку результатом. Я приведу несколько примеров результатов:
ввод:

 AT3G52150   GO:0009570  GO:0009941  GO:0009570  GO:0009535  GO:0009579  GO:0009941  GO:0009507  GO:0009570  GO:0009570  GO:0009570  GO:0009570  GO:0009570  GO:0009579  GO:0009507  GO:0009507  GO:0009570  GO:0009579  GO:0009535  GO:0009579  GO:0009570  GO:0009570  GO:0009507  GO:0009507  GO:0009941  GO:0009941  GO:0009507  GO:0009570  GO:0009570  GO:0009535  GO:0009535  GO:0009535  
AT1G56450   GO:0022626  GO:0022626  GO:0005839  GO:0005737  GO:0005829  GO:0022626  GO:0022626  GO:0005737  GO:0000502  GO:0005839  
AT3G07100   GO:0005789  GO:0030127  GO:0033116  GO:0000139  GO:0030127  GO:0005789  GO:0005789  GO:0000139  GO:0033116  GO:0033116  GO:0030127  GO:0005737  GO:0005789  GO:0000139  GO:0000139  
AT1G07040   GO:0009507  
  

вывод:

 [1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0044424" "GO:0044464" "all"       
[1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0044424" "GO:0044464" "all"       
[1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0044424" "GO:0044464" "all"       
[1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0005737" "GO:0043231" "GO:0009536" "GO:0043226"
[1] "GO:0043227" "GO:0043229" "GO:0044424" "GO:0044444" "GO:0044464" "all" 
  

Я объясню, что означает этот результат, поэтому я объединил разные клеточные компоненты ОДНОГО номера доступа и получил их родительский элемент (используя GOCCANCESTOR в R). Таким образом, каждая строка в выходных данных, которые я вставил выше, является родительской, принадлежащей компонентам ячейки одного accesionnumber.

Однако я не понимаю выходных данных. Я предполагаю, что «все» является вершиной иерархии всех терминов GO клеточного компонента (не уверен в этом, потому что я не смог найти никакой документации по этому поводу).
Итак, я подумал, что дальше вправо означает выше в иерархии, однако, если это правда, было бы странно, что с левой стороны все термины go одинаковы, я бы ожидал этого с правой стороны, если «все» означает вершину.
Я надеюсь, что кто-то знаком с терминами GO или с GOCCANCESTOR в R

Обновить
В случае, если эти термины не отсортированы, как я могу отсортировать их, чтобы получить минимально возможный уровень в иерархии?

Я не был уверен, нужно ли мне публиковать это в stackoverflow или biology, поэтому, если вы считаете, что это не следует публиковать здесь, дайте мне знать

Комментарии:

1. Было бы полезно, если бы вы показали термин (ы), для которого вы получили этот результат. Но, как правило, не похоже, что они сортируются либо слева направо, либо справа налево. Например, оба термина GO: 0005623 и GO: 0044464 являются дочерними терминами GO: 0005575.

2. Спасибо, я обновил свой вопрос @KonradRudolph (термины go — это некоторые другие, которые я только что показал в своем вопросе перед редактированием, потому что я не смог быстро найти для этого ввод)