Анализ сетевых эффектов: граф, центральность, кластеры и retention

Senior Python Соцсети

Условие задания

**Данные:** DataFrame `friendships` с колонками: `user_id_1`, `user_id_2`, `created_at`. DataFrame `users` с колонками: `user_id`, `registered_at`, `last_active_at`, `is_churned`.

**Задание:**
1. Постройте граф связей пользователей (networkx)
2. Рассчитайте метрики центральности: degree, betweenness, closeness
3. Найдите кластеры (communities) алгоритмом Louvain / greedy modularity
4. Проанализируйте связь между центральностью / размером кластера и retention

Пример данных

Структура для ориентира — реальные значения из эталонного решения.

users = pd.DataFrame({
    'user_id': range(n_users),
    'registered_at': pd.date_range('2023-06-01', periods=n_users, freq='3h'),
    'last_active_at': None,
    'is_churned': False,
})

Темы

pandas networkx граф центральность кластеризация retention

Подсказки

Все тестовые задания →

Частые вопросы

Какой уровень знаний нужен для задачи "Анализ сетевых эффектов: граф, центральность, кластеры и retention"?

Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.

На каких собеседованиях встречается такая задача?

Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, networkx, граф, центральность, кластеризация.

Сколько времени даётся на решение?

На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.

Где ещё потренироваться по теме «Python»?

На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.

← Все задания