#python-3.x #airflow-scheduler #airflow
#python-3.x #airflow-планировщик #поток воздуха
Вопрос:
У меня есть фиктивная задача и список задач, которые выполняются с использованием параллельного цикла, и только для одной задачи я хочу иметь еще одну последовательную задачу.
То, что я пробовал до сих пор, это:
dummy = DummyOperator(task_id='Dummy'.upper(),
dag=dag)
final = DummyOperator(task_id='FinalTask'.upper(),
dag=dag)
for task in ['Task1', 'Task2', 'Task3']:
if task == 'Task1'
task1 = DummyOperator(task_id='Task1-a'.upper(),
dag=dag)
else:
...
else:
...
tasks = DummyOperator(task_id=task),
dag=dag)
dummy >> tasks
tasks >> task1
tasks >> final
Ответ №1:
Вы не объяснили логику, как мы знаем, каковы подзадачи Task1.
Это должно создать желаемую структуру:
tasks = ['Task1', 'Task2', 'Task3']
default_args = {
'owner': 'airflow',
'start_date': datetime(2020, 12, 17),
}
with DAG(
dag_id='dummyplay2',
default_args=default_args,
schedule_interval=None,
) as dag:
start_op = DummyOperator(task_id='start')
final_op = DummyOperator(task_id='final')
for task in tasks:
task_op = DummyOperator(task_id=task)
start_op >> task_op
if task == 'Task1':
#This loop creates the sub task logic.
#You can replace ord('b') with ord('z) and it will create more sub tasks
for i in range(ord('a'), ord('b') 1):
sub_task_op = DummyOperator(task_id=f'{task}_{chr(i)}')
task_op >> sub_task_op >> final_op
else:
task_op >> final_op
DAG будет: