У кластера Kube при высокой нагрузке возникают ошибки тайм-аута при подключении к внешней службе

#kubernetes #azure-aks

#kubernetes #azure-aks

Вопрос:

У меня есть два кластера azure kube, каждый из которых подключается к ms dynamics. А при высокой нагрузке (сотни вызовов в минуту) соединение начинает выдавать ошибки тайм-аута (« org.apache.http.conn.HttpHostConnectException «). Примерно в 10% случаев.

И, похоже, эта ошибка исходит от определенных узлов. Таким образом, если 20 модулей распределены по 8 узлам, ошибка будет только у модулей, которые находятся, скажем, на 4 из узлов. Другие модули / узлы обрабатывают столько же вызовов, но без ошибок.

Это тоже длится уже много дней. Таким образом, один и тот же модуль / узлы имели ошибку в течение 10 дней.

Кто-нибудь сталкивался с этим?
Как я могу устранить проблему с этим?

ПРИМЕЧАНИЕ: Это не 429 ошибок отказа в подключении.

Комментарии:

1. Можете ли вы предоставить общий доступ к журналам с затронутых узлов и модулей?

2. Каков размер вашего диска? Возможно, вас регулируют. Проверьте статистику сети и ввода-вывода.