#kubernetes
#kubernetes
Вопрос:
После попыток с различными поставщиками (голый kubernetes, openshift, aws eks) мы обнаружили, что даже если у узла достаточно ресурсов (cpu, ram, hdd) после достижения ~ 110 модулей, новые модули зависают в состоянии ожидания без каких-либо событий или ошибок, кроме события
"Successfully assigned {namespace}/{pod_name} to {node_name}"
Мы пытались искать какие-либо связанные журналы в kubelet, scheduler и т. Д., Но нет ничего, кроме этого события, упомянутого ранее.
Кому-нибудь удалось запустить более 110 модулей на узел? Что мы делаем не так?
Единственное, что стоит дополнительно упомянуть, это то, что в нашем случае это не 110 копий одного и того же модуля, а 110 различных модулей из разных наборов развертываний / демонов. И, конечно, мы изменили node pod_limit> 110.
Ответ №1:
kunernetes поддерживает 110 модулей на узел. С нескольких каналов поступают запросы на увеличение модулей на узел.
PR поднят для поддержки 500 модулей на узел. тем не менее, он все еще открыт. вы можете отслеживать статус по ссылке ниже
Комментарии:
1. Но почему тогда есть возможность изменить это ограничение, если оно все равно не будет работать выше 110 модулей в настоящее время? Как насчет aws eks? Этот параметр там не поддается управлению и полностью зависит от типа экземпляра. Например, узел m5.4xlarge имеет 16 ядер и 64 ГБ оперативной памяти, что дает вам емкость модуля 249 (понятия не имею, как его вычисляет Amazon). Но он просто перестал запускать новые модули после достижения 110.
2. @StanislavOgarkov AWS вычисляет это,
(IP per ENI limit) * (ENI per instance limit)
затем сбрасывает этоmax IPs per instance
со счетов по IP-адресам, необходимым самому узлу.
Ответ №2:
В то время как текущая цель масштабирования составляет 500 модулей на узел (см. https://github.com/kubernetes/community/blob/master/sig-scalability/goals.md ), в зависимости от того, о каком количестве узлов вы говорите, вы можете оказаться на территории, где настройки планировщика по умолчанию больше не помогают. К сожалению, настройка планировщика — это немного темное искусство, я бы рекомендовал обратиться за помощью в канал Slack для масштабирования сигналов.