#filesize
#размер файла
Вопрос:
У меня есть файл FASTA с каждым геномом коронавируса. К сожалению, мой компьютер выходит из строя, если я пытаюсь его запустить. Я был бы счастлив, если бы мог взять каждую десятую или пятидесятую последовательность и сохранить ее в другом файле. (Я знаю о BLAST, но это не работает для моих целей, потому что это не случайно.) Есть ли какой-нибудь способ сделать это онлайн?
Комментарии:
1. Что вы делаете, на каком языке программирования. Последовательный доступ. Последовательности ACGT могут быть закодированы в памяти; символ Java потребует в 8 раз больше памяти.
2. Я говорю компьютеру прочитать идентификатор и последовательность файла fasta и сохранить (скажем) каждую десятую последовательность id в другой файл. Я знаком с R и Python, так что это то, с чем я пытался.
3. Следует прочитать файл построчно, используя буфер фиксированной длины. Я не знаю, работает ли Python по-прежнему медленно.