#unix #bowtie
#unix #bowtie2
Вопрос:
С помощью bowtie2-build я создал индексный файл генома arabidopsis Araport11 (https://www.arabidopsis.org/download/index-auto.jsp?dir=/download_files/Genes/Araport11_genome_release ), где я использовал Araport11_cdna_20160703_representative_gene_model.gz для транскриптома. Затем я создал файлы .bam моих одноконцевых операций чтения с помощью bowtie2 и преобразовал их в .bam с помощью samtools sort . Что я хотел бы сделать сейчас, так это создать csv-файл с подсчетом прочитанного, а также файл gtf с stringtie. Для этого я получил эти файлы для руководств по аннотациям: Araport11_GFF3_genes_transposons.201606.gff.gz amp; Araport11_GFF3_genes_transposons.201606.gtf.gz . Я применил gunzip к этим файлам.
Однако, когда я пытаюсь запустить stringtie {input} -eB -G {любой из руководств .gff или .gtf} -o {output}
Я получаю следующее предупреждение для файлов .gff- и .gtf guide: ПРЕДУПРЕЖДЕНИЕ: для геномных последовательностей, в которых были сопоставлены чтения, не найдено ссылочных транскриптов! Пожалуйста, убедитесь, что файл аннотации -G использует то же соглашение об именовании для последовательностей генома.
И когда затем выполняется prepDE.py , он содержит соответствующие AGI arabidopsis в виде строк и соответствующие столбцы, относящиеся к конкретным образцам (представляющие чтения каждого образца). Однако все значения в файле равны нулю!
Очевидно, что-то пошло не так. Кроме того, при ручном поиске генов, которые перечислены в моих файлах .bam в файлах .gff и.gtf, на самом деле есть результаты! Таким образом, кажется, что одно и то же соглашение об именовании правильное. Что я здесь делаю не так?