Как вы выполняете основные функции с файлом, который слишком велик для вашего компьютера?

#filesize

#размер файла

Вопрос:

У меня есть файл FASTA с каждым геномом коронавируса. К сожалению, мой компьютер выходит из строя, если я пытаюсь его запустить. Я был бы счастлив, если бы мог взять каждую десятую или пятидесятую последовательность и сохранить ее в другом файле. (Я знаю о BLAST, но это не работает для моих целей, потому что это не случайно.) Есть ли какой-нибудь способ сделать это онлайн?

Комментарии:

1. Что вы делаете, на каком языке программирования. Последовательный доступ. Последовательности ACGT могут быть закодированы в памяти; символ Java потребует в 8 раз больше памяти.

2. Я говорю компьютеру прочитать идентификатор и последовательность файла fasta и сохранить (скажем) каждую десятую последовательность id в другой файл. Я знаком с R и Python, так что это то, с чем я пытался.

3. Следует прочитать файл построчно, используя буфер фиксированной длины. Я не знаю, работает ли Python по-прежнему медленно.