Как найти положение каждого основания в последовательности в формате fasta

#perl

#perl

Вопрос:

Пожалуйста, помогите найти положение последовательности в формате fasta, начальная позиция которой равна 35658014, а конечная позиция равна 35657750 в 3′ и 5′ областях соответственно.И моя последовательность строится по строкам.

Благодарю вас

Комментарии:

1. Вам придется предоставить нам гораздо больше информации. Предположим, никто не знает, как выглядит последовательность в формате fasta. Предположим, никто не знает, что вы подразумеваете под 3′ и 5′ регионами.

Ответ №1:

Вы пытаетесь получить фактический генный код в этих местах? Я не знаю Био Perl, но если это просто строка, вот что вы можете сделать:

Во-первых, это регулярное выражение удалит мусор из строки:

 $seq =~ s/^>*. n//;
 

И это приведет к удалению новых строк

 $seq =~ s/n//g;
 

Затем просто используйте обычную подстроку perl: http://perldoc.perl.org/functions/substr.html

 my $section = substr($seq, $start-1, $end-$start);
 

Это предполагает, что ваши начальные и конечные значения первого элемента равны 1.

Конечно, если вы уже используете bioperl (вероятно, так и должно быть), используйте функцию subseq: http://doc.bioperl.org/releases/bioperl-1.0.1/Bio/Seq.html#POD8 . На этой странице достаточно информации для чтения в последовательности FASTA и получения из нее кода на основе начала и конца.