Короткие задания Flink не экспортируют поле prometheus job_name

#apache-flink #flink-streaming #flink-batch

#apache-flink #flink-потоковая передача #flink-batch

Вопрос:

[ОПИСАНИЕ]

Я запускаю Flink 1.11.1 на Kubernetes и настраиваю стек мониторинга с помощью Prometheus и Grafana.

Я заметил, что запуск примера WordCount в кластере Flink (отправленный через пользовательский интерфейс) не возвращается $(job_name) в prometheus.

Для устранения неполадок я загрузил примеры заданий flink WordCount и заставил их работать дольше, используя Thread.sleep() . Как видно на скриншоте ниже, я запустил задание, а затем более длинную версию.

более короткий и длительный снимок экрана

Только второй запуск (более длинные задания) экспортирует $(job_name) поле в prometheus, как показано ниже на скриншоте панели инструментов Grafana ( label_values(job_name) ). Это указывает на то, что более короткие выполняемые задания не экспортируют данное поле.

поле имени задания на панели управления Grafana

Я также попытался запустить pushgateway exporter с предлагаемыми настройками Flink, что привело к тому же результату, что и выше.

[ВОПРОС]

Есть ли способ собрать метрику job_name из коротких заданий, мои настройки неверны? Или это невозможно сделать из-за интервала очистки на prometheus? Спасибо.