Менеджер предупреждений Prometheus — высокий уровень процессора не предупреждает

#prometheus #prometheus-alertmanager

Вопрос:

Я настроил диспетчер оповещений prometheus, но он не предупреждает, когда процессор одного из моих серверов используется на 99%. Это предупреждение :

 - alert: HostHighCpuLoad  expr: avg(irate(node_cpu_seconds_total{mode="idle"}[1m]) * 100) lt; 30  for: 1m  labels:  severity: warning  annotations:  summary: "High usage on {{ $labels.instance }}"  description: "{{ $labels.instance }} has a average CPU idle (current value: {{ $value }}s)"  

Это похоже на мое выражение, возьмите среднее значение по всему миру для всех моих серверов, но мне нужно отслеживать этот показатель для каждого отдельного сервера.

У кого-то уже есть эта проблема ?

Ответ №1:

Да, это с учетом среднего значения по всем инстанциям. Измените выражение на:

 avg by (instance) (irate(node_cpu_seconds_total{mode="idle"}[1m]) * 100) lt; 30  

Комментарии:

1. Большое вам спасибо !