#prometheus #prometheus-alertmanager
Вопрос:
Я настроил диспетчер оповещений prometheus, но он не предупреждает, когда процессор одного из моих серверов используется на 99%. Это предупреждение :
- alert: HostHighCpuLoad expr: avg(irate(node_cpu_seconds_total{mode="idle"}[1m]) * 100) lt; 30 for: 1m labels: severity: warning annotations: summary: "High usage on {{ $labels.instance }}" description: "{{ $labels.instance }} has a average CPU idle (current value: {{ $value }}s)"
Это похоже на мое выражение, возьмите среднее значение по всему миру для всех моих серверов, но мне нужно отслеживать этот показатель для каждого отдельного сервера.
У кого-то уже есть эта проблема ?
Ответ №1:
Да, это с учетом среднего значения по всем инстанциям. Измените выражение на:
avg by (instance) (irate(node_cpu_seconds_total{mode="idle"}[1m]) * 100) lt; 30
Комментарии:
1. Большое вам спасибо !