Как запросить счетчик, который движется медленно и точно

#prometheus #grafana

Вопрос:

У меня есть счетчик в Prometheus, который подсчитывает некоторые ошибки в приложении. На нем также есть несколько меток, указывающих на вариации ошибок. Эти ошибки не являются распространенными, и счетчик движется медленно.

Я хочу, чтобы в моей панели мониторинга Grafana был индикатор, который показывает количество ошибок за выбранный период времени. Что ж, я изо всех сил старался добиться этого, но без особого успеха. Я попытался rate() , increase() , Total агрегировать результаты, большие Min Interval s, но ни один из них не смог дать мне хорошего результата с точки зрения точности. Я обычно получаю числа с десятичными дробями (для количества ошибок!), очень разные результаты при изменении интервалов и других настроек, а иногда (особенно при использовании increase() ) результаты , далекие от реальности (кто-то сказал мне, что это может быть связано с псевдонимами, что смешно, так как я здесь не обрабатываю высокочастотные сигналы!).

Итак, я прихожу к выводу, что «Прометей» — неправильный способ решения этой проблемы, но я все еще сомневаюсь, что есть способ достичь моей цели с помощью этой установки, которую я упускаю. В конце концов, эти события являются сущностями времени, и Прометей существует для того, чтобы справляться с такими вещами.

Я буду рад услышать любые предложения или помощь по моей проблеме. Я заранее признателен вам за это.