Запуск скрипта Python как systemd service, подключение к InfluxDB приводит к ошибке подключения

#python #systemd #influxdb #influxdb-python #system-services

#python #systemd #influxdb #influxdb-python #system-services

Вопрос:

Я запускаю сценарий оболочки в качестве службы systemd Ubuntu для запуска во время загрузки. Скрипт внутренне выполняет скрипт Python (python_simulator.py), который подключается к InfluxDB (через пакет influxdb Python).

Скрипт Python не запускается во время загрузки, и проверка журналов предполагает, что это из-за ‘ConnectionError‘ при подключении к InfluxDB. Я интерпретировал это так, что, возможно, служба influxdb не запущена к моменту активации службы Python во время загрузки. Итак, я попытался добавить зависимость порядка в сервис, добавив «После» и «Хочет» как «influxdb.service«, который активирует службу Python через несколько секунд после службы influxdb. Но я все еще получаю ту же ошибку подключения.

Служба systemd (myservice.service) выглядит следующим образом:

 [Unit]
Description= Python startup service.
After=influxdb.service
Wants=influxdb.service

[Service]
Type=forking
ExecStart=/bin/bash /home/test_user/Deploy/start.sh
ExecStop=/bin/bash /home/test_user/Deploy/stop.sh

[Install]
WantedBy=multi-user.target
  

Файл журнала скрипта Python (python_simulator.py ):

 Traceback (most recent call last):
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connection.py", line 159, in _new_conn
    (self._dns_host, self.port), self.timeout, **extra_kw)
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/util/connection.py", line 80, in create_connection
    raise err
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/util/connection.py", line 70, in create_connection
    sock.connect(sa)
ConnectionRefusedError: [Errno 111] Connection refused

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connectionpool.py", line 600, in urlopen
    chunked=chunked)
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connectionpool.py", line 354, in _make_request
    conn.request(method, url, **httplib_request_kw)
  File "/usr/lib/python3.6/http/client.py", line 1239, in request
    self._send_request(method, url, body, headers, encode_chunked)
  File "/usr/lib/python3.6/http/client.py", line 1285, in _send_request
    self.endheaders(body, encode_chunked=encode_chunked)
  File "/usr/lib/python3.6/http/client.py", line 1234, in endheaders
    self._send_output(message_body, encode_chunked=encode_chunked)
  File "/usr/lib/python3.6/http/client.py", line 1026, in _send_output
    self.send(msg)
  File "/usr/lib/python3.6/http/client.py", line 964, in send
    self.connect()
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connection.py", line 181, in connect
    conn = self._new_conn()
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connection.py", line 168, in _new_conn
    self, "Failed to establish a new connection: %s" % e)
urllib3.exceptions.NewConnectionError: <urllib3.connection.HTTPConnection object at 0x7f817d91b400>: Failed to establish a new connection: [Errno 111] Connection refused

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/adapters.py", line 449, in send
    timeout=timeout
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connectionpool.py", line 638, in urlopen
    _stacktrace=sys.exc_info()[2])
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/util/retry.py", line 399, in increment
    raise MaxRetryError(_pool, url, error or ResponseError(cause))
urllib3.exceptions.MaxRetryError: HTTPConnectionPool(host='localhost', port=8086): Max retries exceeded with url: /query?q=SHOW DATABASES (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7f817d91b400>: Failed to establish a new connection: [$

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "python_simulator.py", line 467, in <module>
    main(host=args.host, port=args.port)
  File "python_simulator.py", line 312, in main
    for db_dict in client.get_list_database():
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/influxdb/client.py", line 570, in get_list_database
    return list(self.query("SHOW DATABASES").get_points())
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/influxdb/client.py", line 416, in query
    expected_response_code=expected_response_code
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/influxdb/client.py", line 267, in request
    timeout=self._timeout
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/sessions.py", line 533, in request
    resp = self.send(prep, **send_kwargs)
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/sessions.py", line 646, in send
    r = adapter.send(request, **kwargs)
  File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/adapters.py", line 516, in send
    raise ConnectionError(e, request=request)
requests.exceptions.ConnectionError: HTTPConnectionPool(host='localhost', port=8086): Max retries exceeded with url: /query?q=SHOW DATABASES (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7f817d91b400>: Failed to establish a new connection$
  

Наконец, блокирующее дерево демонов показывает, что myservice.service выполняется после influxdb.service:

 myservice.service  6.872s
└─influxdb.service @11.344s
  └─network-online.target @11.337s
    └─NetworkManager-wait-online.service @4.706s  6.630s
      └─NetworkManager.service @3.940s  674ms
        └─dbus.service @3.914s
          └─basic.target @3.728s
            └─sockets.target @3.728s
              └─snapd.socket @3.722s  5ms
                └─sysinit.target @3.712s
                  └─apparmor.service @3.276s  435ms
                    └─local-fs.target @3.266s
                      └─run-user-1000.mount @49.841s
                        └─swap.target @3.160s
                          └─dev-disk-byx2duuid-16e1b46ax2d79fcx2d4965x2d9932x2d8f589e9e7057.swap @3.132s  23ms
                            └─dev-disk-byx2duuid-16e1b46ax2d79fcx2d4965x2d9932x2d8f589e9e7057.device @3.130s
  

Я не уверен, почему я все еще не могу выполнить скрипт (python_simulator.py) с influxdb на месте. Существуют ли какие-либо другие зависимости? Необходимы ли какие-либо изменения в myservice.service? Любая помощь будет оценена.

Редактировать 1:

Может ли причиной быть ConnectionRefusedError вместо ConnectionError, и это может быть связано с тем, что к моменту подключения к influence на порту 8086 его ничего не прослушивает? Если да, то как я могу упорядочить это в порядке зависимости?

Ответ №1:

Вы все равно можете столкнуться с проблемой, даже если создадите зависимость от сервиса (потому что возможно, что influxdb потребуется некоторое время, прежде чем он будет готов принимать соединения, в течение которого может запуститься код Python). Решение состоит в том, чтобы либо:

  • напишите свой код Python, чтобы повторить попытки подключения, когда они отклоняются или
  • настройте systemd на перезапуск вашей службы в случае сбоя.

Не видя вашего кода на Python, трудно предположить, как может выглядеть первое решение, но настроить ваш модуль на перезапуск при сбое так же просто, как добавить следующее в ваш [Service] раздел:

 Restart=on-failure
  

Вы можете отложить запуск вашего кода Python до тех пор, пока influxdb не будет готова, добавив небольшой сценарий оболочки в свой системный блок:

 ExecStartPre=/bin/sh -c 'while ! curl -sf http://localhost:8086/ping; do sleep 1; done'
  

Это будет повторяться бесконечно (таким образом, предотвращая запуск службы) до тех пор, пока influxdb успешно не ответит на /ping конечную точку.

Комментарии:

1. Сценарий оболочки, который запускается как служба systemd, выполняет скрипт Python и некоторые другие вещи. Его статус всегда активен (выполняется) , даже если скрипт Python потерпел неудачу. Возможно ли, чтобы служба systemd ждала, пока не появится порт 8086?

2. Я добавил одно возможное решение к ответу, хотя я думаю, что любое из предыдущих двух предложений было бы лучше (потому что что произойдет, если вам придется перезапустить службу influxdb после того, как ваш код Python уже запущен?)

3. Я согласен, что настройка systemd на перезапуск при сбое является лучшим решением. Но, как я уже сказал, ошибка при выполнении .py не приводит к сбою службы .sh и, следовательно, она не будет перезапущена.

4. Тем не менее, решение дождаться порта 8086 сработало просто отлично. Чтобы проверить, что произойдет, если influxdb остановится, он фактически остановил и myservice. Я предполагаю, что это потому, что у меня были желания как influxdb.service в myservice.service. Хотя, я ожидаю, что он перезапустится, так как я поставил «Restart = on-failure» (может быть, потому, что он «мертв» и он не вышел из строя)

5. Спасибо за это. Однако (я не исследовал «глубоко») это не сработает для меня, пока я не добавлю TimeoutSec=360 в модуль, а также ping. Смотрите также: unix.stackexchange.com/questions/227017 /…