Тайм-аут ответа сервера Kubernetes API

#kubernetes #kubernetes-apiserver #argo-workflows

#kubernetes #kubernetes-apiserver #argo-рабочие процессы

Вопрос:

Я вижу, что некоторые из наших рабочих процессов завершаются сбоем из-за ошибки тайм-аута соединения. Мы используем Argo Workflow manager для выполнения заданий. мы наблюдаем, что Argo теряет подключение к своим рабочим процессам, и наша взаимозависимая схема рабочего процесса завершается сбоем с приведенными ниже ошибками. итак, когда я проверил журналы сервера Kubernetes API, я вижу эти ошибки. могу ли я каким-либо образом увеличить какие-либо настройки тайм-аута для незаконченных заданий сервера Kubernetes API?

Ошибки:

 status.go:71] apiserver received an error that is not an metav1.Status: amp;net.OpError{Op:"write", Net:"tcp", Source:(*net.TCPAddr)(0xc095d6de90), Addr:(*net.TCPAddr)(0xc095d6dec0), Err:(*os.SyscallError)(0xc0287c4d00)}
E0817 17:14:46.575773 1 status.go:71] apiserver received an error that is not an metav1.Status: amp;net.OpError{Op:"write", Net:"tcp", Source:(*net.TCPAddr)(0xc07d555530), Addr:(*net.TCPAddr)(0xc07d555560), Err:(*os.SyscallError)(0xc0be7c70e0)}
E0817 17:14:46.576855 1 status.go:71] apiserver received an error that is not an metav1.Status: amp;net.OpError{Op:"write", Net:"tcp", Source:(*net.TCPAddr)(0xc07c5a03f0), Addr:(*net.TCPAddr)(0xc07c5a0420), Err:(*os.SyscallError)(0xc07c7454e0)}
E0817 17:15:28.402137 1 status.go:71] apiserver received an error that is not an metav1.Status: amp;net.OpError{Op:"write", Net:"tcp", Source:(*net.TCPAddr)(0xc09013ea20), Addr:(*net.TCPAddr)(0xc09013ea50), Err:(*os.SyscallError)(0xc0cd00f520)}
E0817 17:23:48.779008 1 runtime.go:78] Observed a panic: amp;errors.errorString{s:"killing connection/stream because serving request timed out and response had been started"} (killing connection/stream because serving request timed out and response had been started)
  

Версия клиента: v1.17.2

Версия сервера: v1.17.2

Операционная система хоста: Centos 7.7

CNI: Переплетение

Спасибо, CS

Комментарии:

1. Какую версию Argo вы используете? Есть ли какие-либо журналы в контроллере Argo, которые могут быть полезны?

2. Вы устранили эту проблему?