Метаданные воздушного потока DB = airflow_db?

#airflow

#воздушный поток

Вопрос:

У меня есть требование проекта по резервному копированию базы метаданных воздушного потока в какое-либо хранилище данных (но без использования базы данных воздушного потока). В то же время в требовании упоминается какое-то вызываемое соединение airflow_db .

Я совсем новичок в Airflow, поэтому я немного погуглил по этой теме. Я немного смущен этой частью. Наша база метаданных воздушного потока — PostgreSQL (она построена из docker-compose, поэтому я работаю над локальной установкой), но когда я смотрю на соединения в веб-интерфейсе воздушного потока, он говорит airflow_db , что это MySQL.

введите описание изображения здесь

Изначально я предполагал, что они одинаковы, но, судя по всему, это не так? Может кто-нибудь объяснить разницу и для чего они нужны?

Ответ №1:

Воздушный airflow_db поток создает идентификатор соединения с MySQL по умолчанию (см. Исходный код)

Соединения по умолчанию не очень полезны в производственной системе. Это просто длинный список вещей, которые вы, вероятно, не собираетесь использовать.

Airflow 1.1.10 ввел возможность не создавать список по умолчанию, установив: load_default_connections = False in airflow.cfg (см. PR)

Чтобы дать больше информации, список подключений — это место, где крючки находят информацию, необходимую для подключения к службе. Это не связано с серверной базой данных. Хотя серверная часть является db, как и любая db, и если вы хотите разрешить хукерам взаимодействовать с ней, вы можете определить ее в списке, как и любое другое соединение (вероятно, поэтому у вас есть эта опция по умолчанию).