Собеседование на аналитика данных в Яндексе 2026 — это 4-5 раундов: скрининг с рекрутером, технический SQL/Python, секция A/B и статистики, продуктовый кейс и финал с менеджером. Главное, что отделяет оффер от отказа на грейдах middle и senior, — не знание синтаксиса, а умение вслух связать бизнес-вопрос с метрикой, дизайном эксперимента и SQL-запросом. Ниже разбор каждого раунда, чего ждут по грейдам и какие red flags заваливают кандидатов.
Яндекс — один из самых частых запросов у тех, кто готовится к собесам в РФ. Формат у компании зрелый и предсказуемый: они оценивают не «вызубрил ли ты оконные функции», а как ты думаешь над неопределённой задачей. Если разложить процесс на части и потренировать каждую, шансы резко растут.
Из каких раундов состоит собеседование аналитика в Яндексе?
Стандартный пайплайн в 2026 году выглядит так:
- Скрининг с рекрутером (30-40 мин) — мотивация, опыт, грейд, зарплатные ожидания. Технику почти не трогают, но могут спросить про стек и крупные проекты.
- Технический раунд SQL + Python (60 мин) — задачи на запросах и обработке данных в pandas. Часто в общем редакторе с выполнением кода.
- Статистика и A/B-тесты (45-60 мин) — дизайн эксперимента, проверка значимости, подвохи метрик. Иногда объединяют с продуктовым раундом.
- Продуктовый кейс (45-60 мин) — открытая бизнес-задача: метрика просела, что делаешь.
- Финал с нанимающим менеджером / behavioral (45 мин) — командная работа, конфликты, провалы, ценности.
На junior-позициях раундов может быть меньше (часто 3-4), на senior добавляют system-design аналитики и более жёсткий продуктовый блок. Подробный разбор раундов и зарплатных вилок по грейдам собран на странице подготовки к собесу в Яндекс.
Чего ждут по грейдам: Junior, Middle, Senior?
Один и тот же вопрос на разных грейдах оценивают по-разному. Ориентир:
| Грейд | SQL | A/B и статистика | Продуктовое мышление |
|---|---|---|---|
| Junior | JOIN, GROUP BY, простые подзапросы | Понимает p-value, ошибки I/II рода | Считает метрику по формуле |
| Middle | Оконные функции, CTE, дедупликация | Считает size/power, ловит SRM | Сам выбирает метрику под задачу |
| Senior | Оптимизация, сложные когорты, антипаттерны | CUPED, многократные сравнения, switchback | Строит дерево метрик, видит trade-off |
Главное отличие senior — он не ждёт уточнений, а сам проговаривает допущения: «считаю, что одна сессия = один пользователь в день, иначе метрика поедет на ботах». Именно это, а не количество выученных функций, двигает грейд вверх.
Какие SQL-задачи дают на собесе?
SQL — обязательный раунд для всех аналитиков. Типичные темы:
- Оконные функции: «выведи топ-3 товара по выручке внутри каждой категории» —
ROW_NUMBER() OVER (PARTITION BY category ORDER BY revenue DESC). - Когортный retention: посчитать долю вернувшихся пользователей по неделям регистрации.
- Воронка: посчитать конверсию между шагами через
COUNT(DISTINCT user_id)с фильтрами по этапам. - Дедупликация: оставить последнюю запись на пользователя —
ROW_NUMBER()+ фильтрWHERE rn = 1. - Подвох с NULL: помнить, что
NOT IN (подзапрос с NULL)вернёт пустой результат, аCOUNT(column)игнорирует NULL в отличие отCOUNT(*).
Совет: проговаривай план до того, как пишешь. «Сначала отфильтрую по дате, потом сгруппирую, потом возьму оконку» — интервьюер ставит галочку за структуру, даже если синтаксис местами хромает. Отработать эти паттерны на исполняемых задачах с настоящим PostgreSQL можно в SQL-тренажёре.
Что спрашивают по A/B-тестам и статистике?
Этот раунд — где сыпется больше всего кандидатов, потому что заучить тут нельзя. Частые вопросы:
- Дизайн эксперимента: «хотим проверить новую кнопку, как спланируешь тест?» Ждут: метрика, единица рандомизации, расчёт
размер выборки = функция от MDE, дисперсии, мощности и alpha, срок. - Значимость: чем p-value отличается от доверительного интервала, что такое ошибки I и II рода.
- Подвохи: что такое peeking (подглядывание до конца теста раздувает FPR), SRM (Sample Ratio Mismatch — перекос в долях групп говорит о баге сплитования).
- Снижение дисперсии: CUPED — корректировка метрики на доэкспериментальное поведение, чтобы быстрее набрать мощность.
- Множественные сравнения: если тестируешь 10 метрик, нужна поправка (Бонферрони или Бенджамини-Хохберг), иначе ложноположительные.
Хороший ответ всегда заканчивается решением: «вижу SRM 52/48 при ожидаемых 50/50 — тест не валиден, иду проверять сплитователь, результаты не интерпретирую». Разбор сотен таких вопросов с формулировками — в разделе вопросы с собеседований.
Как разбирать продуктовый кейс?
Продуктовый кейс — открытая задача без единственно верного ответа. Классика: «DAU упал на 15% за неделю, твои действия». Структура сильного ответа:
- Уточни вопрос: какой продукт, какой сегмент, точечный спад или тренд.
- Декомпозируй: DAU = новые + вернувшиеся + удержанные. Где именно просело.
- Выдвини гипотезы: технический сбой, сезонность, релиз, внешний фактор (праздники, конкурент).
- Проверь данными: по сегментам, платформам, географии — ищем где аномалия локализована.
- Дай рекомендацию с числом: «если падение только на Android после релиза — откатываем и меряем восстановление DAU».
Главная ошибка — сразу нырять в «я бы построил дашборд» без структуры. Интервьюер хочет увидеть фреймворк мышления. Натренировать декомпозицию на реальных бизнес-сценариях можно в разделе кейсов, а прогнать живой диалог с разбором — в AI-интервьюере.
Что спрашивают на behavioral-раунде?
Финальный раунд с менеджером проверяет, как ты работаешь в команде. Типичные вопросы:
- Расскажи про проект, которым гордишься (и что конкретно сделал ты, а не команда).
- Был ли конфликт с продактом/разработчиком, как разрешил.
- Случай, когда твой анализ оказался неверным — что сделал.
- Как приоритизируешь задачи, когда всё горит.
Отвечай по схеме STAR: Ситуация — Задача — Действие — Результат, обязательно с цифрами в результате. «Нашёл баг в атрибуции, пересчитал — оказалось, канал недооценён на 30%, перераспределили бюджет» звучит в разы сильнее, чем «я хорошо работаю с командой».
Какие red flags заваливают кандидата?
То, что чаще всего приводит к отказу даже при норм технике:
- Молчание над задачей. Думать вслух обязательно — иначе интервьюер не видит логику.
- Не уточняешь вводные. Бросаешься решать кейс, не спросив контекст — минус сразу.
- Метрика без бизнес-смысла. Считаешь ради счёта, не связывая с решением.
- Игнорируешь подвохи A/B. Не упомянул SRM, peeking, сезонность — провал статистического раунда.
- Результат без числа. В behavioral «улучшил процесс» вместо «сократил время отчёта с 3 часов до 20 минут».
- Самоуверенность при ошибке. Не признал, что запрос неверный, когда интервьюер намекнул.
Где потренироваться перед собесом в Яндекс
Подготовка работает, когда тренируешь каждый раунд отдельно, а не читаешь теорию подряд:
- SQL-тренажёр — оконки, когорты, воронки на настоящем PostgreSQL с автопроверкой.
- Продуктовые кейсы — разбор открытых бизнес-задач с фреймворком и эталонным решением.
- AI-интервьюер — живой мок-собес с вопросами в формате Яндекса и обратной связью.
- Вопросы с собеседований — банк реальных вопросов по SQL, статистике и продукту.
- Гид по собесу в Яндекс — раунды, грейды, зарплатные вилки и темы по компании.
Пройди каждый блок хотя бы раз вслух — и на реальном собесе формат уже не застанет врасплох.