Обновление группы узлов EKS с 1.17 до 1.18 не удалось из — за сбоя AsgInstanceLaunchFailures-как это исправить?

#upgrade #amazon-eks

Вопрос:

У меня есть кластер EKS, который прошел обновление с 1.17 до 1.18. Кластер состоит из 2 групп узлов (обновляется с помощью консоли AWS).

Плоскость управления EKS и обновление одной из групп узлов были в порядке.

Последняя группа узлов, обновление которой завершилось неудачно из — за проблемы со здоровьем AsgInstanceLaunchFailures - One or more target groups not found. Validating load balancer configuration failed. , и теперь группа узлов помечена как Degraded .

когда я получаю доступ к идентификатору обновления, я вижу следующую ошибку:

 NodeCreationFailure - Couldn't proceed with upgrade process as new nodes are not joining node group {NODE_GROUP_NAME}
 

Я попытался получить доступ к ASG с этим идентификатором, и я вижу, что к нему подключено несколько целевых групп для балансировки нагрузки.
Я не смог найти способ исправить это в документах AWS.

Есть какие-нибудь советы?

Ответ №1:

Проблема решена.

похоже, что в кластер вручную была добавлена пустая целевая группа (еще 3 целевые группы были созданы автоматически). Как только пустая целевая группа была удалена, обновление было успешно завершено.

Я все еще не понимаю, как EKS выбирает правильную целевую группу для обновления, когда их несколько.