dbt vs Airflow: в чём разница и можно ли совмещать

**dbt** и **Airflow** — два главных инструмента Modern Data Stack 2026. Они **дополняют, не заменяют** друг друга. dbt — это transformation tool (что делать с данными которые уже в БД, через SQL). Airflow — orchestration (как и когда запускать любые задачи: extract, load, transform, ML, notifications). На собесе на middle+ Data Analytics Engineer обязательно спросят разницу. Здесь — детальное сравнение и сценарии совместного использования.

Сравнительная таблица

Параметр Dbt Airflow
Фокусdbt: SQL transformationAirflow: любая orchestration
Где работаетdbt: внутри warehouseAirflow: снаружи (Python)
Языкdbt: SQL + JinjaAirflow: Python (DAG как код)
Schedulingdbt: нет (через Airflow/Prefect/dbt Cloud)Airflow: cron + сложные расписания
Testsdbt: data tests (SQL)Airflow: unit-tests кода + assertions
Lineagedbt: авто из SQL ref()Airflow: через DAG-структуру
Documentationdbt: автогенерацияAirflow: нужно вручную
Materializationdbt: view/table/incrementalAirflow: что напишешь в Python
Кривая обученияdbt: 1-2 недели (если знаешь SQL)Airflow: 2-4 недели (нужны Python + DAG-mental-model)

Когда что использовать

Когда Dbt

  • Когда вся transformation-логика — SQL (95% случаев data-pipeline)
  • Нужны автогенерация документации, lineage, tests
  • Команда из аналитиков (не DE/DataOps)
  • Используешь modern warehouse (Snowflake, BigQuery, Redshift, ClickHouse)
  • ELT-pattern (extract+load простой, всё в transformation)

Когда Airflow

  • Когда нужно оркестрировать комплексные pipelines (extract из API → ML → train → deploy)
  • Сложные расписания (не просто daily)
  • Условная логика, branching, dynamic DAGs
  • Когда transformation НЕ в SQL (Python-only, Spark)
  • Когда у вас уже есть DE-команда

FAQ

dbt или Airflow — что учить первым?

dbt — проще и быстрее даёт value. Если знаешь SQL, освоишь за 1-2 недели. Airflow — следующий шаг после dbt, требует Python и DAG-mental-model.

Заменит ли dbt Airflow?

Нет. dbt только для SQL-transformation. Airflow для всего остального: extract из API, ML training, file processing, notifications. Они работают в связке: Airflow orchestrates, dbt does SQL.

Какая типичная архитектура dbt + Airflow?

Airflow DAG: 1) Extract from API → S3 (Python operator), 2) Load S3 → Snowflake, 3) `dbt run` для transformation, 4) `dbt test` для проверки качества, 5) Notify Slack. Каждый шаг — отдельный task.

Что вместо Airflow в 2026?

Prefect (3 — современный orchestrator), Dagster (native dbt integration), Mage (low-code), Temporal (для durable workflows). Airflow всё ещё стандарт enterprise.

Источники

Практика по теме → Полный гайд в блоге →

Другие сравнения

Postgresql vs Clickhouse · Pandas vs Polars · Tableau vs Powerbi Datalens Superset · SQL vs Pandas