Используйте полное имя хоста для мониторинга Apache Flink akka

#kubernetes #apache-flink

#kubernetes #apache-flink

Вопрос:

Я настраиваю один JobManager в кластере HA с ZooKeeper и 3 TaskManagers. Я делаю это в kubernetes, и мне нужно, чтобы JM обращался к TM по полному имени хоста ( hostname -f нет hostname ), поскольку они находятся в наборе с отслеживанием состояния.

В настоящее время, похоже, что TM сообщают о своем адресе JM только как nostname…

 2019-04-12 08:58:32,426 WARN  akka.remote.ReliableDeliverySupervisor                        - Association with remote system [akka.tcp://flink-metrics@flink-taskmanager-1:50011] has failed, address is now gated for [50] ms. Reason: [Association failed with [akka.tcp://flink-metrics@flink-taskmanager-1:50011]] Caused by: [flink-taskmanager-1: Name or service not known]
2019-04-12 08:58:32,427 WARN  akka.remote.ReliableDeliverySupervisor                        - Association with remote system [akka.tcp://flink-metrics@flink-taskmanager-0:50011] has failed, address is now gated for [50] ms. Reason: [Association failed with [akka.tcp://flink-metrics@flink-taskmanager-0:50011]] Caused by: [flink-taskmanager-0: Name or service not known]
2019-04-12 08:58:32,431 WARN  akka.remote.ReliableDeliverySupervisor                        - Association with remote system [akka.tcp://flink-metrics@flink-taskmanager-2:50011] has failed, address is now gated for [50] ms. Reason: [Association failed with [akka.tcp://flink-metrics@flink-taskmanager-2:50011]] Caused by: [flink-taskmanager-2: Name or service not known]
  

Я просмотрел варианты здесь, в частности taskmanager.host , но это не имело никакого эффекта.

Как я могу заставить TM сообщать свой адрес JM либо как полное имя хоста, либо как пользовательское значение?

 root@flink-taskmanager-0:/opt/flink# hostname
flink-taskmanager-0
root@flink-taskmanager-0:/opt/flink# hostname -f
flink-taskmanager-0.fl-taskmanager-headless-service.default.svc.cluster.local
  

Комментарии:

1. Возможно, я ответил на свой собственный вопрос. taskmanager.host кажется, теперь работает. Я думаю, единственное, что я сделал по-другому, это очистил состояние ZooKeeper… Обновится, если это сработает….

Ответ №1:

Чтобы ответить на мой собственный вопрос: taskmanager.host была ли правильная конфигурация. Я не знаю точно, какие изменения, которые я внес, заставили его начать работать, но я предполагаю, что это связано с тем, что я очищаю данные flink ZooKeeper.