Snakemake: Conda env загружается/устанавливается крайне медленно на GKE

# #conda #google-kubernetes-engine #snakemake

Вопрос:

В настоящее время я экспериментирую с выполнением своего рабочего процесса snakemake без GKE. Я заметил огромные расхождения во времени, которое требуется для настройки одной и той же среды conda на разных блоках.

Например, в этом модуле для загрузки и установки env fastq2bam потребовалось почти 40 минут.

 2021-10-04T21:30:12.013016030ZBuilding DAG of jobs...
2021-10-04T21:30:14.088986292ZCreating conda environment workflow/envs/fastq2bam.yml...
2021-10-04T21:30:14.089894547ZDownloading and installing remote packages.
2021-10-04T22:09:06.496554997ZEnvironment for workflow/envs/fastq2bam.yml created (location: .snakemake/conda/a6dd1d801207b0464f4fb8c9ad01dfa5)
 

В то время как на другом модуле создание одного и того же env заняло всего около 3 минут.

 2021-10-04T21:32:41.695487553ZBuilding DAG of jobs...
2021-10-04T21:32:43.602866802ZCreating conda environment workflow/envs/fastq2bam.yml...
2021-10-04T21:32:43.603565305ZDownloading and installing remote packages.
2021-10-04T21:35:03.559349719ZEnvironment for workflow/envs/fastq2bam.yml created (location: .snakemake/conda/a6dd1d801207b0464f4fb8c9ad01dfa5)
 

Единственная реальная разница, о которой я могу думать между блоками, — это количество процессоров, запрашиваемых ими. Медленный модуль запрашивает 1 ядро, в то время как более быстрый имеет 10 ядер. Но я не думаю, что процессоры могут быть проблемой здесь?

Комментарии:

1. В общем, для установки пакетов в среде conda я настоятельно рекомендую использовать mamba вместо conda. Кроме того, рекомендуемый способ установки snakemake -через мамбу

2. Спасибо, я уже знаю. И я верю, что Snakemake также использует мамбу для установки пакетов.