#airflow
#воздушный поток
Вопрос:
У меня есть требование проекта по резервному копированию базы метаданных воздушного потока в какое-либо хранилище данных (но без использования базы данных воздушного потока). В то же время в требовании упоминается какое-то вызываемое соединение airflow_db
.
Я совсем новичок в Airflow, поэтому я немного погуглил по этой теме. Я немного смущен этой частью. Наша база метаданных воздушного потока — PostgreSQL (она построена из docker-compose, поэтому я работаю над локальной установкой), но когда я смотрю на соединения в веб-интерфейсе воздушного потока, он говорит airflow_db
, что это MySQL.
Изначально я предполагал, что они одинаковы, но, судя по всему, это не так? Может кто-нибудь объяснить разницу и для чего они нужны?
Ответ №1:
Воздушный airflow_db
поток создает идентификатор соединения с MySQL по умолчанию (см. Исходный код)
Соединения по умолчанию не очень полезны в производственной системе. Это просто длинный список вещей, которые вы, вероятно, не собираетесь использовать.
Airflow 1.1.10 ввел возможность не создавать список по умолчанию, установив: load_default_connections = False
in airflow.cfg
(см. PR)
Чтобы дать больше информации, список подключений — это место, где крючки находят информацию, необходимую для подключения к службе. Это не связано с серверной базой данных. Хотя серверная часть является db, как и любая db, и если вы хотите разрешить хукерам взаимодействовать с ней, вы можете определить ее в списке, как и любое другое соединение (вероятно, поэтому у вас есть эта опция по умолчанию).