Datadog: как предупредить, если модуль запущен в kubernetes

#kubernetes #datadog

#kubernetes #datadog

Вопрос:

Я использую datadog для мониторинга работоспособности нескольких модулей, развернутых в кластере kubernetes. Я использую такой запрос для проверки модулей

 avg(last_5m):avg:kubernetes.pods.running{environment:develop,kube_service:service} <= 0
 

Если я остановлю модуль, для kubernetes.pods.running не будет никаких данных (поэтому значение не равно нулю, у меня нет никакого значения). Я не знаю, можно ли проверить из datadog, что ни в одном модуле не запущен kube_service.

Ответ №1:

Вы можете обратиться к другим метрикам datadog kube, таким как kubernetes.replicas.available / total, чтобы предупредить, если нет доступных — total < 0. То же самое можно сделать или для модулей daemonset также доступна определенная метрика. [Datadog docs-kube metrics] [1] [1]: https://docs.datadoghq.com/agent/kubernetes/data_collected/

Комментарии:

1. Спасибо. Я решаю проблему, используя данные kubernetes_state.deployment.replicas и группируя их по kube_deployment 🙂