Как анализировать записи журнала pbs_server, pbs_mom сервера и рабочего узла

#pbs #torque

#pbs #крутящий момент

Вопрос:

Как я могу проанализировать эти записи журнала, я хочу понять, каков формат этих записей журнала?

1) PBS_Server; LOG_ERROR:: Не удается назначить запрошенный адрес (99) в send_job, ошибка send_job на d23818f7 порт 15002

2) pbs_mom; LOG_ALERT::mom_server_valid_message_source, плохое соединение с 210.56.24.244:1023 — неавторизованный сервер

Ответ №1:

Имя /var/spool/torque/server_name на вычислительных хостах и на сервере должно совпадать и должно разрешаться по одному и тому же адресу. Если этого не произойдет, проверьте /etc/hosts , nsswitch.conf , и DNS, чтобы разобраться с этим.

РЕДАКТИРОВАТЬ # 1: кроме того, я бы обязательно поместил вывод hostname команды на сервере в server_name файл на всех машинах.

РЕДАКТИРОВАТЬ # 2: также имейте в виду, что $pbsserver in /var/spool/torque/mom_priv/config на вычислительных узлах переопределит значение в server_name файле. (Так что лучше не использовать $pbs_server .)