**Контекст:** Социальная сеть анализирует граф дружеских связей для выявления лидеров мнений и сообществ.
**Данные:**
- DataFrame `users` — колонки: `user_id`, `username`, `followers_count`, `posts_last_30d`, `avg_likes_per_post`
- DataFrame `friendships` — колонки: `user_a`, `user_b`, `created_at` (неориентированные связи)
**Задание:**
1. Постройте граф и рассчитайте метрики: degree, betweenness, closeness, PageRank
2. Обнаружьте сообщества (community detection — Louvain)
3. Создайте influence score = 0.3*PageRank_norm + 0.3*betweenness_norm + 0.2*followers_norm + 0.2*engagement_norm
4. Найдите топ-10 инфлюенсеров и ключевых «мостовых» узлов между сообществами
Структура для ориентира — реальные значения из эталонного решения.
users = pd.DataFrame({
'user_id': range(n_users),
'username': [f'user_{i}' for i in range(n_users)],
'followers_count': np.random.lognormal(5, 1.5, n_users).astype(int),
'posts_last_30d': np.random.poisson(8, n_users),
'avg_likes_per_post': np.random.lognormal(3, 1, n_users).round(1),
})
pandas networkx граф centrality communities influence
Это задание для уровня Senior. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: pandas, networkx, граф, centrality, communities.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания