#r #bioconductor
#r #bioconductor
Вопрос:
Я пытаюсь получить предковый термин go из списка терминов go. Я использовал bioconductor в R для этой задачи. Но я совершенно сбит с толку результатом. Я приведу несколько примеров результатов:
ввод:
AT3G52150 GO:0009570 GO:0009941 GO:0009570 GO:0009535 GO:0009579 GO:0009941 GO:0009507 GO:0009570 GO:0009570 GO:0009570 GO:0009570 GO:0009570 GO:0009579 GO:0009507 GO:0009507 GO:0009570 GO:0009579 GO:0009535 GO:0009579 GO:0009570 GO:0009570 GO:0009507 GO:0009507 GO:0009941 GO:0009941 GO:0009507 GO:0009570 GO:0009570 GO:0009535 GO:0009535 GO:0009535
AT1G56450 GO:0022626 GO:0022626 GO:0005839 GO:0005737 GO:0005829 GO:0022626 GO:0022626 GO:0005737 GO:0000502 GO:0005839
AT3G07100 GO:0005789 GO:0030127 GO:0033116 GO:0000139 GO:0030127 GO:0005789 GO:0005789 GO:0000139 GO:0033116 GO:0033116 GO:0030127 GO:0005737 GO:0005789 GO:0000139 GO:0000139
AT1G07040 GO:0009507
вывод:
[1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0044424" "GO:0044464" "all"
[1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0044424" "GO:0044464" "all"
[1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0044424" "GO:0044464" "all"
[1] "GO:0005622" "GO:0005575" "GO:0005623" "GO:0005737" "GO:0043231" "GO:0009536" "GO:0043226"
[1] "GO:0043227" "GO:0043229" "GO:0044424" "GO:0044444" "GO:0044464" "all"
Я объясню, что означает этот результат, поэтому я объединил разные клеточные компоненты ОДНОГО номера доступа и получил их родительский элемент (используя GOCCANCESTOR в R). Таким образом, каждая строка в выходных данных, которые я вставил выше, является родительской, принадлежащей компонентам ячейки одного accesionnumber.
Однако я не понимаю выходных данных. Я предполагаю, что «все» является вершиной иерархии всех терминов GO клеточного компонента (не уверен в этом, потому что я не смог найти никакой документации по этому поводу).
Итак, я подумал, что дальше вправо означает выше в иерархии, однако, если это правда, было бы странно, что с левой стороны все термины go одинаковы, я бы ожидал этого с правой стороны, если «все» означает вершину.
Я надеюсь, что кто-то знаком с терминами GO или с GOCCANCESTOR в R
Обновить
В случае, если эти термины не отсортированы, как я могу отсортировать их, чтобы получить минимально возможный уровень в иерархии?
Я не был уверен, нужно ли мне публиковать это в stackoverflow или biology, поэтому, если вы считаете, что это не следует публиковать здесь, дайте мне знать
Комментарии:
1. Было бы полезно, если бы вы показали термин (ы), для которого вы получили этот результат. Но, как правило, не похоже, что они сортируются либо слева направо, либо справа налево. Например, оба термина GO: 0005623 и GO: 0044464 являются дочерними терминами GO: 0005575.
2. Спасибо, я обновил свой вопрос @KonradRudolph (термины go — это некоторые другие, которые я только что показал в своем вопросе перед редактированием, потому что я не смог быстро найти для этого ввод)