Мониторинг облака Google: добавьте предупреждение, если публикация завершается успешно, а подписка завершается неудачно

#google-cloud-platform #google-cloud-pubsub #google-cloud-monitoring

#google-облачная платформа #google-cloud-pubsub #google-cloud-мониторинг

Вопрос:

Я хочу добавить оповещение в Google Cloud Monitoring таким образом, чтобы для данной темы и подписки я хотел знать, публикуется ли тема, тогда подписки не подтверждаются с той же или аналогичной скоростью в течение заданного периода времени.

Как этого добиться с помощью оповещений в Google Cloud Monitoring или StackDriver?

Я попробовал подход, при котором у меня есть 2 условия для удовлетворения:

  1. Если операции публикации> 0,016 / сек в течение 2 минут (что означает по крайней мере одну публикацию в минуту)
  2. Если подтверждения подписки <0,001 / сек в течение 2 минут (если подтверждения подписки не происходят в течение 2 минут)

Затем оповещение.

Здесь происходит то, что при низкой загрузке, если, скажем, в течение 3 минут не происходит никаких публикаций, и происходит публикация, оба условия 1 и 2 имеют значение true, и разработчики получают предупреждение об этом как об ошибке.

Итак, каков правильный способ разработки таких оповещений?

Если мой подход близок к тому, что я хочу, следующие вопросы, которые приходят мне на ум:,

  1. Есть ли способ сказать, что вы считаете свои две минуты с момента, когда происходит публикация, чтобы узнать, удовлетворяет ли условие подтверждения или нет.
  2. Или есть ли способ заставить оповещение подождать 2-3 минуты, чтобы узнать, разрешится ли инцидент, а затем отправить оповещение разработчикам.
  3. Или, есть ли способ, которым мы можем подсчитать случаи выполнения этих условий, а затем оповещать, только если количество случаев превышает 5 или 10 за 15 минут или что-то в этом роде.

Извините за длинный пост. Но любая помощь приветствуется.

Ответ №1:

Для расчета частоты для задач используется временной интервал в 2-3 минуты. Итак, если у вас было 0 задач в течение 2 минут или дольше, эта проблема повторяется. Это описано в документации о частичных показателях. Кроме того, в этой ссылке есть обходные пути.

Вы можете попробовать создать свои собственные пользовательские показатели.