#bioinformatics #ncbi
#биоинформатика #ncbi
Вопрос:
Я пытаюсь найти файл gene_info с именами генов и расположением хромосом. Однако, похоже, я не могу найти его на FTP-сайте NCBI. Кто-нибудь может дать мне указатель?
Ответ №1:
Смотрите: ftp://ftp.ncbi.nlm.nih.gov/gene/DATA/README подробную информацию о том, что в каких файлах, можно получить на ftp-сайте NCBI.
Если вы хотите получить данные из самого NCBI, вам нужно будет объединить несколько файлов, возможно, gene2accession (который также включает информацию о местоположении) и файл gene_info, Который сопоставляет идентификаторы с символами и именами и т.д.
Вероятно, удобнее перейти на сайт UCSC для получения этой информации, они также предоставляют общедоступную базу данных mysql, если вы хотите изучить, что доступно:http://workshops.arl.arizona.edu/sql1/sql_workshop/mysql/mysqlclient.html
Если вам просто нужны данные о человеке, мыши или крысе, то в базе данных генома крысы уже собраны нужные вам данные (свежие из источников NCBI и Ensembl): ftp://rgd.mcw.edu/pub/data_release
например, для человеческих данных посмотрите на: ftp://rgd.mcw.edu/pub/data_release/GENES_HUMAN.txt