**Данные:** DataFrame `friendships` с колонками: `user_id_1`, `user_id_2`, `created_at`. DataFrame `users` с колонками: `user_id`, `registered_at`, `last_active_at`, `is_churned`.
**Задание:**
1. Постройте граф связей пользователей (networkx)
2. Рассчитайте метрики центральности: degree, betweenness, closeness
3. Найдите кластеры (communities) алгоритмом Louvain / greedy modularity
4. Проанализируйте связь между центральностью / размером кластера и retention
Структура для ориентира — реальные значения из эталонного решения.
users = pd.DataFrame({
'user_id': range(n_users),
'registered_at': pd.date_range('2023-06-01', periods=n_users, freq='3h'),
'last_active_at': None,
'is_churned': False,
})
pandas networkx граф центральность кластеризация retention
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, networkx, граф, центральность, кластеризация.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания