Аналитик данных — одна из самых востребованных профессий в IT. На hh.ru ежедневно 3000+ вакансий с пометкой "аналитик". Порог входа адекватный: не нужно знать алгоритмы на уровне Codeforces. Нужны SQL, базовый Python, понимание метрик и умение объяснить выводы бизнесу.
Этот гайд — конкретный план: что учить, в каком порядке, какие задачи решать и как пройти собеседование в Яндекс, Ozon, Сбер, Авито или Тинькофф.
Кто такой аналитик данных
Часто путают разные роли. Вот чем они отличаются:
| Роль | Чем занимается | Ключевые инструменты | Зарплата Middle |
|---|---|---|---|
| Data Analyst | SQL-запросы, дашборды, ad-hoc отчёты | SQL, ClickHouse, Superset | 180-250K |
| Product Analyst | Метрики продукта, A/B-тесты, воронки | SQL, Python, Amplitude | 200-300K |
| BI Analyst | Визуализация, ETL для дашбордов | Tableau, Power BI, DataLens | 170-250K |
| Data Engineer | Пайплайны, хранилища, инфраструктура | Python, Airflow, Spark, Kafka | 250-400K |
Зарплаты аналитиков в 2026
Зарплаты по компаниям (данные Levels.fyi)
| Компания | Junior | Middle | Senior | Lead / Principal |
|---|---|---|---|---|
| Яндекс | 130-165K | 200-300K | 350-540K | 500K+ |
| Ozon | 120-160K | 190-280K | 280-400K | 400K+ |
| Сбер | 110-150K | 190-250K | 280-400K | 450K+ |
| Авито | 130-170K | 200-300K | 320-450K | 450K+ |
| Тинькофф | 120-160K | 180-270K | 300-420K | 400K+ |
| VK | 120-155K | 180-260K | 280-380K | 380K+ |
| Стартап | 80-130K | 150-220K | 220-320K | по договорённости |
Какие навыки нужны
Что нужно на каком уровне
| Навык | Junior | Middle | Senior |
|---|---|---|---|
| SQL | SELECT, JOIN, GROUP BY, WHERE | Оконные функции, CTE, подзапросы | Оптимизация, EXPLAIN, партиционирование |
| Python | pandas basics, читать код | pandas свободно, визуализация | ML-библиотеки, автоматизация |
| Метрики | Знать DAU, Retention, CR | Декомпозиция метрик, unit-экономика | KPI-дерево, North Star, OKR |
| A/B-тесты | Понимать что это и зачем | Дизайн теста, интерпретация | CUPED, MDE, sequential testing |
| Инструменты | Excel, один BI-инструмент | ClickHouse, Superset, Git | Airflow, dbt, архитектура DWH |
Зачем каждый навык и где его применяешь
SQL — фундамент всего
Без SQL аналитик не работает. Это как английский для международного бизнеса — без него никуда. Каждый день ты пишешь запросы: от простых "сколько заказов вчера" до сложных когортных анализов с оконными функциями.
Что конкретно учить:
- JOIN — объединение таблиц (INNER, LEFT, FULL). Без этого не соберёшь ни один отчёт
- GROUP BY + агрегаты — SUM, COUNT, AVG по группам. Основа любого дашборда
- Оконные функции — ROW_NUMBER, LAG, SUM OVER. Спрашивают на каждом собесе
- CTE (WITH) — разбить сложный запрос на читаемые блоки
- QUALIFY, HAVING — фильтрация после группировки и оконных функций
Python — для глубокого анализа
SQL отлично считает агрегаты, но когда нужно построить график, обработать JSON, сделать статистический тест — нужен Python. Аналитик пишет не production-код, а Jupyter-ноутбуки: загрузил данные, покрутил, построил визуализацию, сделал вывод.
Что учить:
- pandas — DataFrame, groupby, merge, pivot_table, apply
- matplotlib / seaborn — графики для отчётов
- numpy — массивы, статистика
- scipy.stats — t-test, chi-square для A/B-тестов
Продуктовые метрики — язык бизнеса
Аналитик, который знает SQL, но не понимает метрики — просто выгружальщик данных. Тебя нанимают не за запросы, а за инсайты. Нужно понимать: что такое retention, почему он падает, как связан с LTV, что с этим делать.
Ключевые метрики:
- DAU/MAU — активность пользователей
- Retention D1/D7/D30 — удержание по когортам
- LTV — сколько приносит пользователь за жизнь
- CAC — стоимость привлечения
- Conversion Rate — конверсия по воронке
- ARPU/ARPPU — выручка на пользователя
A/B-тесты и статистика
На собеседованиях аналитика всегда спрашивают про A/B-тесты. Это не опционально — это обязательный навык. Нужно понимать: как дизайнить тест, сколько трафика нужно, как интерпретировать результат, когда можно раскатывать.
Что учить:
- p-value, уровень значимости — когда результат надёжный
- Ошибки I и II рода — ложные срабатывания и пропуски
- MDE — минимальный эффект, который тест может поймать
- CUPED — ускорение тестов (спрашивают на middle+ уровне)
Пошаговый план на 6 месяцев
Python: синтаксис, pandas (read_csv, groupby, merge, pivot_table), matplotlib (базовые графики).
Практика: SQL-тренажёр — решай по 3-5 задач в день. Python-тренажёр — начни с Easy.
Статистика: нормальное распределение, p-value, доверительные интервалы, t-тест.
A/B-тесты: дизайн теста, расчёт выборки, интерпретация результатов.
Практика: 317 метрик — изучай по 2-3 в день. Конспекты — раздел A/B-тесты.
Тестовые задания: реальные задания от Яндекса, Ozon, Сбера — SQL + Python + дашборд.
Мок-собеседования: тренировка формата "вопрос-ответ" с обратной связью.
Практика: 412 кейсов, 497 тестовых заданий, AI мок-собеседование.
Как проходит собеседование
Собеседование аналитика обычно состоит из 3-4 этапов. Каждый проверяет разное:
| Этап | Что проверяют | Формат | Где тренироваться |
|---|---|---|---|
| HR-скрининг | Мотивация, зарплатные ожидания, опыт | Звонок 20-30 мин | Подготовь рассказ о себе |
| Техническое | SQL, Python, теорвер, статистика | Задачи на доске / shared screen | SQL-тренажёр, Python |
| Продуктовый кейс | Метрики, декомпозиция, бизнес-мышление | Обсуждение 30-60 мин | 412 кейсов, метрики |
| Финал | Culture fit, вопросы команде | Встреча с руководителем | Подготовь вопросы |
Техническое интервью — как устроено
Техническое интервью обычно идёт 60-90 минут и состоит из 4 блоков. Порядок может меняться, но блоки стандартные:
Решение: По Байесу. P(честная|орёл) = P(орёл|честная) * P(честная) / P(орёл) = 0.5 * 0.5 / 0.75 = 1/3. Вероятность 33%, что монета честная. Больше задач на теорвер
Решение: Нет. Три проблемы: (1) Peeking — смотришь до набора выборки, это инфлейтит p-value. (2) 3 дня мало — novelty effect может исказить результат. (3) Нужно проверить SRM — если соотношение групп не 50/50, данные ненадёжны. Правильно: дождаться запланированного срока и выборки. Конспекты по A/B-тестам
Решение: Используем LAG: SELECT user_id FROM (SELECT user_id, order_date, LAG(order_date) OVER (PARTITION BY user_id ORDER BY order_date) AS prev_date FROM orders) t WHERE DATEDIFF(order_date, prev_date) <= 7 AND prev_date IS NOT NULL. Решать SQL-задачи
Решение: (1) Уточнить: на каком шаге воронки? на какой платформе? в каком сегменте? (2) Гипотезы: баг после релиза, сезонность, изменение трафика (больше "холодных"), конкурент запустил акцию. (3) Проверка: разбить по платформам, проверить логи релизов, посмотреть микс трафика. (4) Решение: если баг — откатить; если трафик — пересмотреть каналы. 412 продуктовых кейсов
Тестовое задание — как не провалить
Многие компании дают тестовое перед или после собеседования. Обычно это:
- Набор данных в CSV/Excel (заказы, пользователи, события)
- 3-5 вопросов на SQL и/или Python
- Построить дашборд или визуализацию
- Сделать выводы и рекомендации
Главные ошибки:
- Красивый дашборд без выводов — аналитик нужен для инсайтов, а не для графиков
- Забыть про edge-cases: NULL, дубли, выбросы
- Не объяснить почему выбрал именно такой подход
- Сдать без проверки — опечатки в SQL, неправильные джойны
Какие инструменты нужно знать
Аналитик работает не только в SQL и Python. Есть стек инструментов, которые встречаются в большинстве компаний:
ClickHouse — база данных для аналитики
Колоночная СУБД от Яндекса. Стандарт аналитики в российском IT. Запрос, который в PostgreSQL выполняется 10 минут, в ClickHouse отработает за 2 секунды. Почти все крупные компании (Яндекс, Ozon, Авито, VK) используют ClickHouse для аналитических запросов.
Что нужно знать: синтаксис похож на стандартный SQL, но есть особенности — toStartOfMonth() вместо DATE_TRUNC, uniq() вместо COUNT(DISTINCT), массивы и вложенные структуры.
BI-инструменты — дашборды и визуализация
Аналитик строит дашборды для бизнеса. Основные инструменты:
| Инструмент | Где используют | Особенности |
|---|---|---|
| Superset | Яндекс, стартапы | Open source, подключается к ClickHouse |
| DataLens | Яндекс Cloud | Бесплатный, интеграция с ClickHouse |
| Tableau | Крупные компании | Мощный, но платный |
| Redash | Стартапы | Простой: SQL → график |
| Metabase | Небольшие команды | Без SQL можно строить графики |
На собеседовании обычно не спрашивают конкретный инструмент — важно понимать принципы визуализации и уметь рассказать какие дашборды строил.
Jupyter Notebook — исследования и ad-hoc
Интерактивная среда: пишешь код, тут же видишь результат. Стандартный инструмент для разведочного анализа, построения графиков, проверки гипотез. На собеседовании могут попросить показать ноутбук с твоим анализом.
Git — контроль версий
Даже аналитик должен уметь: git add, git commit, git push, создать PR. SQL-запросы, dbt-модели, скрипты — всё живёт в репозитории. На собеседовании могут спросить "как вы версионируете свой код?"
Продуктовые кейсы — что спрашивают и как отвечать
Кейсы — самая непредсказуемая часть собеседования. Нет "правильного ответа" — оценивают ход мысли. Вот типичные форматы:
Формат 1: Диагностика метрики
"DAU упал на 20% за неделю. Что делать?"
Структура ответа:
- Уточнить: это все платформы или только iOS/Android? Все регионы? Когда начался спад?
- Декомпозиция: DAU = новые пользователи + вернувшиеся. Что упало? Если новые — проблема с привлечением. Если вернувшиеся — проблема с удержанием.
- Гипотезы: баг после релиза, сезонность, сломался трекинг, конкурент запустил акцию
- Данные: какие таблицы посмотреть, какие запросы написать
- Решение: конкретные рекомендации для команды
Формат 2: Дизайн метрики
"Как измерить качество поиска в приложении?"
Нужно предложить набор метрик:
- Количественные: CTR по результатам, % пустых выдач, % использования фильтров
- Качественные: позиция клика (первый результат vs десятый), время до клика
- Бизнес: конверсия из поиска в покупку, доля выручки от поискового трафика
Формат 3: Дизайн A/B-теста
"Хотим поменять алгоритм рекомендаций. Как протестировать?"
Нужно описать:
- Метрика: что будем сравнивать (CTR на рекомендации, конверсия, AOV)
- Guardrails: что не должно ухудшиться (время загрузки, общая конверсия)
- Выборка: сколько пользователей нужно, как долго тестировать
- Риски: novelty effect, сетевой эффект, каннибализация
Резюме аналитика — что писать
Резюме — первое, что видит рекрутер. У него 10 секунд на решение "пригласить или нет". Что должно быть:
Обязательные блоки
- Заголовок: "Аналитик данных" (не "специалист" и не "junior developer")
- Навыки: SQL (оконные функции, CTE), Python (pandas, matplotlib), BI (Superset/Tableau), A/B-тестирование
- Опыт: даже если нет коммерческого — опиши pet-projects, учебные проекты, фриланс
- Результаты: не "писал SQL-запросы", а "построил дашборд retention, который используют 3 команды"
Чего НЕ надо
- Перечислять 20 технологий, которые видел один раз
- Писать "ответственный, целеустремлённый, командный игрок"
- Ставить фото с вечеринки
- Указывать зарплатные ожидания (обсудишь на созвоне)
Pet-project — замена опыту
Если нет коммерческого опыта, сделай проект:
- Возьми открытый датасет (Kaggle, data.gov.ru)
- Проведи анализ: очистка данных, визуализация, выводы
- Построй дашборд
- Опубликуй на GitHub с README
Один хороший pet-project = полгода "опыта" в глазах рекрутера.
День из жизни аналитика данных
Чтобы понять, подходит ли тебе профессия — вот как выглядит типичный день middle-аналитика в продуктовой компании:
09:50 — Открыл ноутбук, проверил алерты. DAU в норме, пайплайн отработал. Всё зелёное.
10:00 — Дейлик (15 минут). "Вчера: закончил анализ воронки чекаута. Сегодня: начну дизайн A/B-теста. Блокер: жду данные от дата-инженера."
10:30 — Ad-hoc от маркетинга: "Сколько пользователей из рекламного канала X конвертировались за последний месяц?" SQL-запрос, 10 минут, ответ в рабочий чат.
11:00 — Основная работа: дизайн A/B-теста для нового онбординга. Считаешь MDE, размер выборки, выбираешь метрики, описываешь в документе.
12:30 — Обед.
13:30 — Синк с продактом: обсуждаете результаты прошлого A/B-теста. Конверсия выросла на 2.5%, статистически значимо. Решение: раскатываем на 100%.
14:00 — Обновляешь дашборд retention: добавил новый сегмент (пользователи из push-уведомлений), построил когортную таблицу.
15:00 — Груминг (30 минут): продакт показывает задачи на следующий спринт. Аналитик оценивает: "эта задача на 3 SP, эта на 5, а вот эта — нужен spike, сначала разберёмся в данных".
16:00 — Ревью SQL-запроса коллеги. Нашёл: LEFT JOIN теряет строки, нужен INNER. Написал комментарий в PR.
17:00 — Документация: записал результаты A/B-теста в Confluence. Графики, выводы, рекомендации. Скинул ссылку в командный чат.
17:30 — Посмотрел что нового в бэклоге. Интересная задача: "исследовать каннибализацию между мобильным приложением и десктопом". Попросил продакта взять в следующий спринт.
Сколько времени нужно на подготовку
Зависит от стартовой точки:
| Стартовая точка | До Junior | До первого оффера |
|---|---|---|
| С нуля (не IT) | 4-6 месяцев | 6-9 месяцев |
| Из смежной сферы (маркетинг, финансы) | 2-4 месяца | 3-6 месяцев |
| Уже знаешь SQL | 1-2 месяца | 2-3 месяца |
| Из разработки | 2-4 недели | 1-2 месяца |
Это при условии 2-3 часа в день. Если full-time — в 2 раза быстрее.
Где учиться бесплатно
Что доступно бесплатно на платформе:
- SQL-тренажёр — 5 задач с реальными таблицами и мгновенной проверкой
- Python-тренажёр — 5 задач на pandas, numpy, scipy
- 2500+ вопросов — 20 вопросов в день с ответами
- Метрики — 10 ключевых метрик с формулами и SQL
- Конспекты — A/B-тесты, статистика, SQL, ML
- Конспекты — первый модуль каждого учебника
- Материалы — курсы, статьи, инструменты
Где искать работу
hh.ru — основная площадка. Ищи: "аналитик данных", "продуктовый аналитик", "BI аналитик". Фильтруй: без опыта / 1-3 года. В 2026 году активных вакансий — 2000+ ежедневно.
LinkedIn — обязателен для крупных компаний. Заполни профиль, укажи навыки (SQL, Python, A/B testing). Рекрутеры активно ищут аналитиков.
Telegram — самый быстрый канал:
- Каналы с вакансиями для аналитиков
- Профильные чаты аналитиков в Telegram
- Прямые сообщения рекрутерам
Рефералы — лучший способ. Попроси знакомых из IT порекомендовать тебя. Реферальный кандидат проходит быстрее и имеет приоритет.
Частые ошибки при переходе в аналитику
- Зубрить теорию без практики — знать что такое оконные функции и уметь написать ROW_NUMBER() OVER(PARTITION BY ...) — разные вещи. Решай задачи
- Игнорировать soft skills — ты можешь быть гением в SQL, но если не умеешь объяснить результат продакту — тебя не наймут
- Не делать pet-projects — возьми открытый датасет (Kaggle), сделай анализ, построй дашборд, выложи на GitHub. Это заменяет опыт
- Бояться откликаться без "идеального" резюме — Junior-позиции часто закрываются кандидатами без опыта. Главное — показать мотивацию и базовые навыки
- Учить всё сразу — не пытайся освоить SQL, Python, ML, Tableau и Airflow за месяц. Начни с SQL, добавляй по одному навыку
Заключение
Стать аналитиком данных в 2026 — реально. Порог входа ниже, чем в разработку, зарплаты растут, вакансий много. Главное — системный подход: SQL -> Python -> метрики -> кейсы -> собеседования.
Всё, что нужно для подготовки, есть на одной платформе:
- SQL-тренажёр — 300 задач с мгновенной проверкой
- Python-тренажёр — 348 задач на pandas и numpy
- 2500+ вопросов с собеседований
- 412 продуктовых кейсов
- 497 тестовых заданий от реальных компаний
- AI мок-собеседование с обратной связью
- 317 метрик с формулами и SQL
- Конспекты — A/B, статистика, SQL с формулами
Начни с SQL. Прямо сейчас.