#python #systemd #influxdb #influxdb-python #system-services
#python #systemd #influxdb #influxdb-python #system-services
Вопрос:
Я запускаю сценарий оболочки в качестве службы systemd Ubuntu для запуска во время загрузки. Скрипт внутренне выполняет скрипт Python (python_simulator.py), который подключается к InfluxDB (через пакет influxdb Python).
Скрипт Python не запускается во время загрузки, и проверка журналов предполагает, что это из-за ‘ConnectionError‘ при подключении к InfluxDB. Я интерпретировал это так, что, возможно, служба influxdb не запущена к моменту активации службы Python во время загрузки. Итак, я попытался добавить зависимость порядка в сервис, добавив «После» и «Хочет» как «influxdb.service«, который активирует службу Python через несколько секунд после службы influxdb. Но я все еще получаю ту же ошибку подключения.
Служба systemd (myservice.service) выглядит следующим образом:
[Unit]
Description= Python startup service.
After=influxdb.service
Wants=influxdb.service
[Service]
Type=forking
ExecStart=/bin/bash /home/test_user/Deploy/start.sh
ExecStop=/bin/bash /home/test_user/Deploy/stop.sh
[Install]
WantedBy=multi-user.target
Файл журнала скрипта Python (python_simulator.py ):
Traceback (most recent call last):
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connection.py", line 159, in _new_conn
(self._dns_host, self.port), self.timeout, **extra_kw)
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/util/connection.py", line 80, in create_connection
raise err
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/util/connection.py", line 70, in create_connection
sock.connect(sa)
ConnectionRefusedError: [Errno 111] Connection refused
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connectionpool.py", line 600, in urlopen
chunked=chunked)
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connectionpool.py", line 354, in _make_request
conn.request(method, url, **httplib_request_kw)
File "/usr/lib/python3.6/http/client.py", line 1239, in request
self._send_request(method, url, body, headers, encode_chunked)
File "/usr/lib/python3.6/http/client.py", line 1285, in _send_request
self.endheaders(body, encode_chunked=encode_chunked)
File "/usr/lib/python3.6/http/client.py", line 1234, in endheaders
self._send_output(message_body, encode_chunked=encode_chunked)
File "/usr/lib/python3.6/http/client.py", line 1026, in _send_output
self.send(msg)
File "/usr/lib/python3.6/http/client.py", line 964, in send
self.connect()
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connection.py", line 181, in connect
conn = self._new_conn()
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connection.py", line 168, in _new_conn
self, "Failed to establish a new connection: %s" % e)
urllib3.exceptions.NewConnectionError: <urllib3.connection.HTTPConnection object at 0x7f817d91b400>: Failed to establish a new connection: [Errno 111] Connection refused
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/adapters.py", line 449, in send
timeout=timeout
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/connectionpool.py", line 638, in urlopen
_stacktrace=sys.exc_info()[2])
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/urllib3/util/retry.py", line 399, in increment
raise MaxRetryError(_pool, url, error or ResponseError(cause))
urllib3.exceptions.MaxRetryError: HTTPConnectionPool(host='localhost', port=8086): Max retries exceeded with url: /query?q=SHOW DATABASES (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7f817d91b400>: Failed to establish a new connection: [$
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "python_simulator.py", line 467, in <module>
main(host=args.host, port=args.port)
File "python_simulator.py", line 312, in main
for db_dict in client.get_list_database():
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/influxdb/client.py", line 570, in get_list_database
return list(self.query("SHOW DATABASES").get_points())
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/influxdb/client.py", line 416, in query
expected_response_code=expected_response_code
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/influxdb/client.py", line 267, in request
timeout=self._timeout
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/sessions.py", line 533, in request
resp = self.send(prep, **send_kwargs)
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/sessions.py", line 646, in send
r = adapter.send(request, **kwargs)
File "/home/test_user/Deploy/py_venv/lib/python3.6/site-packages/requests/adapters.py", line 516, in send
raise ConnectionError(e, request=request)
requests.exceptions.ConnectionError: HTTPConnectionPool(host='localhost', port=8086): Max retries exceeded with url: /query?q=SHOW DATABASES (Caused by NewConnectionError('<urllib3.connection.HTTPConnection object at 0x7f817d91b400>: Failed to establish a new connection$
Наконец, блокирующее дерево демонов показывает, что myservice.service выполняется после influxdb.service:
myservice.service 6.872s └─influxdb.service @11.344s └─network-online.target @11.337s └─NetworkManager-wait-online.service @4.706s 6.630s └─NetworkManager.service @3.940s 674ms └─dbus.service @3.914s └─basic.target @3.728s └─sockets.target @3.728s └─snapd.socket @3.722s 5ms └─sysinit.target @3.712s └─apparmor.service @3.276s 435ms └─local-fs.target @3.266s └─run-user-1000.mount @49.841s └─swap.target @3.160s └─dev-disk-byx2duuid-16e1b46ax2d79fcx2d4965x2d9932x2d8f589e9e7057.swap @3.132s 23ms └─dev-disk-byx2duuid-16e1b46ax2d79fcx2d4965x2d9932x2d8f589e9e7057.device @3.130s
Я не уверен, почему я все еще не могу выполнить скрипт (python_simulator.py) с influxdb на месте. Существуют ли какие-либо другие зависимости? Необходимы ли какие-либо изменения в myservice.service? Любая помощь будет оценена.
Редактировать 1:
Может ли причиной быть ConnectionRefusedError вместо ConnectionError, и это может быть связано с тем, что к моменту подключения к influence на порту 8086 его ничего не прослушивает? Если да, то как я могу упорядочить это в порядке зависимости?
Ответ №1:
Вы все равно можете столкнуться с проблемой, даже если создадите зависимость от сервиса (потому что возможно, что influxdb потребуется некоторое время, прежде чем он будет готов принимать соединения, в течение которого может запуститься код Python). Решение состоит в том, чтобы либо:
- напишите свой код Python, чтобы повторить попытки подключения, когда они отклоняются или
- настройте systemd на перезапуск вашей службы в случае сбоя.
Не видя вашего кода на Python, трудно предположить, как может выглядеть первое решение, но настроить ваш модуль на перезапуск при сбое так же просто, как добавить следующее в ваш [Service]
раздел:
Restart=on-failure
Вы можете отложить запуск вашего кода Python до тех пор, пока influxdb не будет готова, добавив небольшой сценарий оболочки в свой системный блок:
ExecStartPre=/bin/sh -c 'while ! curl -sf http://localhost:8086/ping; do sleep 1; done'
Это будет повторяться бесконечно (таким образом, предотвращая запуск службы) до тех пор, пока influxdb успешно не ответит на /ping
конечную точку.
Комментарии:
1. Сценарий оболочки, который запускается как служба systemd, выполняет скрипт Python и некоторые другие вещи. Его статус всегда активен (выполняется) , даже если скрипт Python потерпел неудачу. Возможно ли, чтобы служба systemd ждала, пока не появится порт 8086?
2. Я добавил одно возможное решение к ответу, хотя я думаю, что любое из предыдущих двух предложений было бы лучше (потому что что произойдет, если вам придется перезапустить службу influxdb после того, как ваш код Python уже запущен?)
3. Я согласен, что настройка systemd на перезапуск при сбое является лучшим решением. Но, как я уже сказал, ошибка при выполнении .py не приводит к сбою службы .sh и, следовательно, она не будет перезапущена.
4. Тем не менее, решение дождаться порта 8086 сработало просто отлично. Чтобы проверить, что произойдет, если influxdb остановится, он фактически остановил и myservice. Я предполагаю, что это потому, что у меня были желания как influxdb.service в myservice.service. Хотя, я ожидаю, что он перезапустится, так как я поставил «Restart = on-failure» (может быть, потому, что он «мертв» и он не вышел из строя)
5. Спасибо за это. Однако (я не исследовал «глубоко») это не сработает для меня, пока я не добавлю
TimeoutSec=360
в модуль, а также ping. Смотрите также: unix.stackexchange.com/questions/227017 /…