#kubernetes #datadog
#kubernetes #datadog
Вопрос:
Я использую datadog для мониторинга работоспособности нескольких модулей, развернутых в кластере kubernetes. Я использую такой запрос для проверки модулей
avg(last_5m):avg:kubernetes.pods.running{environment:develop,kube_service:service} <= 0
Если я остановлю модуль, для kubernetes.pods.running не будет никаких данных (поэтому значение не равно нулю, у меня нет никакого значения). Я не знаю, можно ли проверить из datadog, что ни в одном модуле не запущен kube_service.
Ответ №1:
Вы можете обратиться к другим метрикам datadog kube, таким как kubernetes.replicas.available / total, чтобы предупредить, если нет доступных — total < 0. То же самое можно сделать или для модулей daemonset также доступна определенная метрика. [Datadog docs-kube metrics] [1] [1]: https://docs.datadoghq.com/agent/kubernetes/data_collected/
Комментарии:
1. Спасибо. Я решаю проблему, используя данные kubernetes_state.deployment.replicas и группируя их по kube_deployment 🙂