**Компания:** Сбер
**Контекст:** Из CRM выгружены данные клиентов с грязными полями: телефоны в разных форматах, email с пробелами, ФИО с лишними символами. Нужно нормализовать данные.
**Пример данных:**
[см. код в задании]
**Задание:**
1. Функция нормализации телефона: вывести в формат +7XXXXXXXXXX
2. Функция нормализации email: lowercase, strip, валидация формата
3. Функция нормализации ФИО: capitalize, убрать лишние пробелы
4. Применить все функции к DataFrame
очистка regex типы данных телефон email
Это задание для уровня easy. Senior-уровень — глубокое понимание темы, опыт решения нестандартных задач, обсуждение trade-off на собеседовании.
Подобные задания в категории «data_engineering» регулярно дают на собеседованиях аналитика данных в Яндекс, Сбер, Ozon, Авито, Тинькофф, Wildberries, T-Bank, X5, ВТБ и других крупных IT-компаниях. Тематика: очистка, regex, типы данных, телефон, email.
На реальном собеседовании на подобную задачу отводится 30-60 минут с обсуждением подходов, оптимизаций и trade-off. Для тренировки рекомендуем сначала решить самостоятельно, потом сверить с эталонным решением и подсказками.
На zasqlpython.ru есть другие задания в категории «data_engineering», продуктовые кейсы, справочник метрик, AI мок-собеседование с разбором ваших ответов.
← Все задания