Упорядочить зависимости задач DAG в airflow

#python-3.x #airflow-scheduler #airflow

#python-3.x #airflow-планировщик #поток воздуха

Вопрос:

У меня есть фиктивная задача и список задач, которые выполняются с использованием параллельного цикла, и только для одной задачи я хочу иметь еще одну последовательную задачу.

введите описание изображения здесь

То, что я пробовал до сих пор, это:

 dummy = DummyOperator(task_id='Dummy'.upper(),
                                              dag=dag)


final = DummyOperator(task_id='FinalTask'.upper(),
                                              dag=dag)


for task in ['Task1', 'Task2', 'Task3']:

    if task == 'Task1'
            task1 = DummyOperator(task_id='Task1-a'.upper(),
                                              dag=dag)

        else:
             ...
    else:
        ...

    tasks = DummyOperator(task_id=task),
                                      dag=dag)

    dummy >> tasks
    tasks >> task1
    tasks >> final
 

Ответ №1:

Вы не объяснили логику, как мы знаем, каковы подзадачи Task1.

Это должно создать желаемую структуру:

 tasks = ['Task1', 'Task2', 'Task3']

default_args = {
    'owner': 'airflow',
    'start_date': datetime(2020, 12, 17),
}

with DAG(
    dag_id='dummyplay2',
    default_args=default_args,
    schedule_interval=None,
) as dag:
    start_op = DummyOperator(task_id='start')
    final_op = DummyOperator(task_id='final')
    for task in tasks:
        task_op = DummyOperator(task_id=task)
        start_op >> task_op
        if task == 'Task1':
            #This loop creates the sub task logic.
            #You can replace ord('b') with ord('z) and it will create more sub tasks
            for i in range(ord('a'), ord('b') 1):
                sub_task_op = DummyOperator(task_id=f'{task}_{chr(i)}')
                task_op >> sub_task_op >> final_op
        else:
            task_op >> final_op
 

DAG будет:

введите описание изображения здесь