Функция Bigquery SQL для проверки всей таблицы на наличие нулевых значений

#google-bigquery #airflow

#google-bigquery #воздушный поток

Вопрос:

Сначала мне нужна функция Bigquery sql для проверки целых таблиц в моем наборе данных на наличие любых нулевых значений.

Во-вторых, основываясь на результатах (найдены нулевые значения или нет), мне нужно выполнить зависимые таблицы нисходящего потока, используя планировщик воздушного потока.

Это условие: если в таблице обнаружены какие-либо нулевые значения, последующая таблица, которая зависит от таблицы, имеющей нулевые значения, должна прекратить выполнение через планировщик воздушного потока.

Ответ №1:

Я не уверен, есть ли у нас какие-либо функции как таковые в Bigquery для сканирования целых таблиц в dataset..

Но для 2.) Мы можем установить правило запуска и соответственно настроить зависимость задачи в airflow, чтобы пропускать последующие задачи при обнаружении нулевых значений. И вы можете остановить dag, вы также можете сохранять оповещение по электронной почте, даже не выполнив задачу, даже если найдено значение null.

https://airflow.apache.org/docs/1.10.2/concepts.html ?выделить=триггер#триггер-правила