#pbs #torque
#pbs #крутящий момент
Вопрос:
Как я могу проанализировать эти записи журнала, я хочу понять, каков формат этих записей журнала?
1) PBS_Server; LOG_ERROR:: Не удается назначить запрошенный адрес (99) в send_job, ошибка send_job на d23818f7 порт 15002
2) pbs_mom; LOG_ALERT::mom_server_valid_message_source, плохое соединение с 210.56.24.244:1023 — неавторизованный сервер
Ответ №1:
Имя /var/spool/torque/server_name
на вычислительных хостах и на сервере должно совпадать и должно разрешаться по одному и тому же адресу. Если этого не произойдет, проверьте /etc/hosts
, nsswitch.conf
, и DNS, чтобы разобраться с этим.
РЕДАКТИРОВАТЬ # 1: кроме того, я бы обязательно поместил вывод hostname
команды на сервере в server_name
файл на всех машинах.
РЕДАКТИРОВАТЬ # 2: также имейте в виду, что $pbsserver
in /var/spool/torque/mom_priv/config
на вычислительных узлах переопределит значение в server_name
файле. (Так что лучше не использовать $pbs_server
.)