# #google-cloud-platform #parallel-processing #google-kubernetes-engine #google-earth-engine #google-cloud-scheduler
Вопрос:
Я пытаюсь найти оптимальный способ распараллеливания следующего:
- Создайте изображение из движка Google Earth и экспортируйте его в хранилище Google Cloud.
- Переместите это изображение из облачного хранилища на виртуальную машину, работающую на облачной платформе Google (скорее всего, с помощью Google Compute Engine).
- Запустите сценарий, который обрабатывает этот образ на виртуальной машине. Это приведет к созданию нового продукта.
- Верните новый продукт в Google Earth Engine в качестве актива Earth Engine.
Эти шаги, вероятно, будут выполняться сотни раз, поэтому потребуется распараллеливание. В облаке Google будет доступно несколько виртуальных машин, которые будут выступать в качестве узлов для обработки входящих данных. Мне нужен способ автоматизировать/запланировать эти задачи. Автомат сможет передавать изображение, сгенерированное с помощью Earth Engine, на доступную виртуальную машину (или узел) и знать, когда ему нужно подождать, прежде чем узел станет доступным для использования, прежде чем отправлять изображение. Может ли Kubernetes решить эту проблему? Я мало что знаю о Kubernetes, но я полностью за любые доступные варианты.
Ответ №1:
Используя Облачный планировщик для планирования и Pub/Sub для распределенного обмена сообщениями, вы можете надежно планировать задачи во множестве экземпляров вычислительных машин.
Если вам нужно запланировать и организовать сложные рабочие процессы в других продуктах или облаках, рассмотрите возможность использования Cloud Composer вместо этого.
В этом документе содержится подробное объяснение использования облачного планировщика.
Комментарии:
1. Большое спасибо! Я займусь этим вопросом.