2-дневный практический курс по Apache AirFlow разработан для специалистов, инженеров данных и архитекторов, отвечающих за настройку и сопровождение потоков данных (Data Flow) в организации и озерах данных под управление Hadoop и AirFlow.
ИТ и интернет18+
Программа курса
Введение в Data Flow
История появления,на чем написан (python)
Основной объект (DAG)
Операторы и таски
Worker
Scheduler, scheduleinterval и executiondate
Pool’ы
Приоритезация
Метаданные
AirflowUI и Webserver
Мониторинг (средства Airflow и кастомные варианты)
Алерты Введение в AirFlow
Логирование
Разработка Data Flow с Apache AirFlow
Создание и основные параметры DAG
Operators и plugins
Hooks, connections, и variables
Работающие из коробки и уже написанные community операторы, хуки и т.п.
Создание тасков
Макросы (Jinja)
Управление зависимостями (внутри DAG, внешние зависимости, timedelta)
Визуализация в WebUI
Настройка расписания
Контекст (выполнения task)
Обмен сообщениями между tasks, DAGS (xcom)
Добавление настраиваемых операторов, сенсоров, хуков и т.п.
Развертывание и настройка Airflow
Установка Apache Airflow в конфигурации по умолчанию (SQLite, SequentialExecutor)
Оставаясь на сайте, вы даете согласие на обработку cookie и персональных данных (узнать подробнее). Если вы не хотите, чтобы данные обрабатывались, покиньте сайт.