Коротко: MAPE (Mean Absolute Percentage Error, средняя абсолютная процентная ошибка) — самая популярная метрика точности прогноза. Показывает, на сколько процентов в среднем прогноз отклоняется от факта. Главный плюс — интерпретируемость («ошибаемся на 8%»), главный минус — взрывается на значениях близких к нулю и штрафует перепрогноз сильнее недопрогноза.
Формула MAPE
MAPE = (100% / n) × Σ | (A_t − F_t) / A_t |
где A_t — фактическое значение, F_t — прогноз, n — число точек. Берём по каждой точке относительную абсолютную ошибку, усредняем, переводим в проценты.
Пример
| День | Факт (A) | Прогноз (F) | \ | A−F\ | /A |
|---|---|---|---|---|---|
| 1 | 100 | 90 | 0.10 | ||
| 2 | 200 | 240 | 0.20 | ||
| 3 | 50 | 45 | 0.10 |
MAPE = 100% × (0.10 + 0.20 + 0.10) / 3 = 100% × 0.40 / 3 ≈ 13.3%
Прогноз в среднем ошибается на ~13%.
Где MAPE ломается
- Нули и около-нулевые факты. Если
A_t = 0, деление на ноль → бесконечность. Любой спрос с нулевыми днями (новый SKU, сезонность) делает MAPE бесполезным. - Асимметрия. MAPE сильнее наказывает прогноз выше факта. Из-за этого модели, минимизирующие MAPE, склонны систематически занижать прогноз.
- Несопоставимость масштабов. На дешёвых товарах процентная ошибка раздувается, на дорогих — занижается.
WAPE — когда есть нули и разные масштабы
WAPE (Weighted Absolute Percentage Error), он же MAD/Mean ratio, делит сумму ошибок на сумму фактов, а не усредняет проценты:
WAPE = Σ |A_t − F_t| / Σ A_t
Для примера выше: (|100−90| + |200−240| + |50−45|) / (100+200+50) = (10+40+5) / 350 = 55/350 ≈ 15.7%.
WAPE не делит на каждый A_t по отдельности → устойчив к нулям и автоматически взвешивает по объёму (крупные позиции важнее). В ритейле и логистике WAPE часто предпочитают MAPE.
sMAPE — симметричный вариант
sMAPE (symmetric MAPE) кладёт в знаменатель полусумму факта и прогноза, чтобы убрать асимметрию:
sMAPE = (100% / n) × Σ ( |A_t − F_t| / ((|A_t| + |F_t|) / 2) )
Плюс — симметрия и ограниченность (0–200%). Минус — менее интуитивна и тоже капризна около нуля. Используется в соревнованиях по прогнозированию (например, M-серии).
Какую метрику выбрать
- MAPE — когда нужна понятная бизнесу цифра и в данных нет нулей.
- WAPE — когда есть нули, разные масштабы, важен объём (ритейл, спрос, склад).
- sMAPE — когда важна симметрия штрафа за пере/недопрогноз.
- В дополнение всегда смотри RMSE/MAE в абсолютных единицах — проценты скрывают масштаб ошибки.
Где потренироваться
- Python-тренажёр — 532 задачи (pandas, NumPy, метрики ошибок).
- Справочник метрик — формулы, примеры, SQL для расчёта.
- Бесплатный курс «SQL с нуля» — считаем агрегаты и отклонения запросами.
- AI мок-собеседование — вопросы про метрики качества моделей с разбором.