Модули разбиты на 4 спринта. Каждый — 1-2 недели. К концу курса можешь объяснить разницу между classical и Bayesian A/B, считать sample size, делать bootstrap CI.
| Спринт | Темы |
|---|---|
| 1. Probability | probability-basics, distributions (normal/binom/poisson/expon) |
| 2. Descriptive | mean/median/mode, variance, correlation (Pearson/Spearman), skewness, CI, bootstrap |
| 3. Inference | hypothesis testing, A/B design, multiple testing (Bonferroni/BH), Bayesian, sequential (mSPRT) |
| 4. Causal | causal inference, DiD, propensity score matching, instrumental variables |
Структура одного модуля (~30-60 мин на изучение):
Конкретные модули из текущей программы:
Большинство базовых курсов по статистике покрывают основы (описательная статистика, t-test, ЦПТ) — этого хватит для начала Junior. Наш курс идёт глубже: Bayesian A/B, sequential testing (mSPRT), causal inference (DiD, PSM, IV). Это уровень Middle/Senior собеса в продуктовых компаниях.
Наш курс — на русском с примерами реальных кейсов (Booking Bayesian A/B, Microsoft mSPRT, Yandex CUPED). Python playgrounds в браузере через Pyodide — решаешь задачу сразу, без установки Anaconda.
Реалистичный план для self-study:
В каждом модуле — интерактивная задача с scipy/numpy. Решаешь прямо в браузере через Pyodide, autocheck через expectedOutput / expectedContains.
# Playground: bootstrap CI для медианы
import numpy as np
from scipy import stats
# Данные: длительность сессии (skewed распределение)
sessions = np.random.exponential(scale=180, size=500) # 500 сессий
# Bootstrap 95% CI для медианы
boot = stats.bootstrap(
(sessions,),
np.median,
confidence_level=0.95,
n_resamples=10000,
random_state=42
)
print(f"Median: {np.median(sessions):.1f} sec")
print(f"95% CI: [{boot.confidence_interval.low:.1f}, {boot.confidence_interval.high:.1f}]")
# Expected output (примерно): Median ~125 sec, CI [110, 145]
Базово — да: производные, интегралы (для понимания PDF). Углублённо — нет. Большинство аналитиков забыли вышмат, но используют scipy.stats без проблем. Главное — понимать что считаешь.
Для собеса 2026 — классическая (t-test, chi-square, p-value) обязательна. Bayesian — bonus, спрашивают на Middle+ в продвинутых компаниях (Yandex, Авито, Tinkoff).
6-8 недель по 1-2 часа в день. Главное практика — после каждой темы 2-3 задачи в Python playground.
После basics — углубление в A/B-тесты (CUPED, sequential), causal inference (DiD, PSM), или ML (sklearn). Зависит от трека: product analyst vs data scientist.
Бесплатные visual-курсы — хороший старт для основ (ЦПТ, t-test). Но не доходят до A/B / Bayesian / causal. Используй как preliminary этап для понимания концепций, потом переходи на наш курс для applied-уровня.
«Statistics» (Freedman) — фундамент, «Practical Statistics for Data Scientists» (Bruce) — applied, «Trustworthy Online Controlled Experiments» (Kohavi) — A/B бестселлер 2020.