**Задание по мотивам реального тестового в Яндексе.**
**Данные:** JSON-файл с поисковыми запросами:
[см. код в задании]
Платформы: `mobile`, `desktop`, `tablet`. Всего ~50 000 запросов.
**Задание:**
1. Загрузите JSON, преобразуйте `ts` в datetime
2. Найдите топ-10 запросов по каждой платформе
3. Постройте распределение трафика по часам для каждой платформы
4. Проведите статистический тест (χ²): различаются ли тематики запросов между mobile и desktop?
5. Визуализируйте результаты
Структура для ориентира — реальные значения из эталонного решения.
df = pd.DataFrame({'query': queries, 'ts': dates, 'platform': platforms})
python pandas JSON статистика хи-квадрат Яндекс
Это задание для уровня Middle. Для middle-аналитиков с опытом 1-3 года, требует уверенного владения темой и понимания edge cases.
Подобные задания в категории «Python» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: python, pandas, JSON, статистика, хи-квадрат.
На реальном собеседовании на подобную задачу отводится 15-30 минут — оцениваются подход, корректность, обработка edge cases. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть 482 Python задачи с проверкой через Pyodide, конспекты Python и pandas, AI мок-собеседование с разбором ваших ответов.
← Все задания