Поведенческая сегментация пользователей через KMeans

Senior Python product

Условие задания

**Контекст:** Задание с собеса в продуктовую команду. Есть агрегированные метрики поведения пользователей — нужно разбить их на 4-6 осмысленных сегментов для персонализации (рассылки, рекомендации, UX).

**Данные:**

[см. код в задании]

**Задание:**

1. Провести KMeans-сегментацию с K=5.
2. Обязательно **стандартизация** (StandardScaler) — метрики в разных шкалах.
3. Вернуть `DataFrame` с оригинальными колонками + `segment` (0..4) + `segment_name` (человеко-читаемое).
4. Интерпретировать центроиды: описать каждый сегмент одним предложением.
5. Проверить что cluster sizes не слишком дисбалансированы (ни один < 5%).

Темы

clustering kmeans pca segmentation sklearn

Подсказки

Все тестовые задания → ← Все задания