Задание воздушного потока не выполняется по расписанию

У меня есть задание, которое я настроил на 9:00 UTC в среду. К концу интервала задержки он не работал, как планировалось, что мне показалось любопытным, потому что я считаю, что все правильно определил.

default_args = {
    'start_date': airflow.utils.dates.days_ago(0),
    'retries': 1,
    'retry_delay': timedelta(minutes=5)
}

dag = DAG(
    'noncomp_trial',
    default_args=default_args,
    description='test of dag',
    schedule_interval='0 9 * * 3',
    dagrun_timeout=timedelta(minutes=20))

Если у кого-то есть какие-либо советы здесь, которые были бы очень признательны!


person ryanf    schedule 23.07.2021    source источник


Ответы (1)


Планировщик воздушного потока запускает задачи после того, как значение start_date + одно значение schedule_interval прошло. В вашем примере группа обеспечения доступности баз данных не будет работать до 9:00 утра в среду на следующей неделе.

Дополнительную информацию о взаимосвязи между start_date и schedule_interval см. здесь.

Вы можете попробовать установить start_date на статическую дату в прошлом на неделю или две, чтобы посмотреть, сработает ли это? И чтобы убедиться, что планировщик не пытается выполнить каждое вхождение start_date + schedule_interval между этим новым start_date и настоящим, вы можете установить catchup=False в DAG. Например:

from datetime import datetime

dag = DAG(
    'noncomp_trial',
    default_args= {
        'start_date': datetime(2021, 7, 1),
        'retries': 1,
        'retry_delay': timedelta(minutes=5)
    },
    description='test of dag',
    schedule_interval='0 9 * * 3',
    dagrun_timeout=timedelta(minutes=20),
    catchup=False,
)

person Josh Fell    schedule 23.07.2021