
ozon · Москва · 14 июн.
Привет! Это команда «Стенды метрик» — мы создали платформу, которая помогает продакт-менеджерам и аналитикам легко проводить A/B-тесты и принимать обоснованные решения на основе данных.
Каждый день продуктовые команды в Ozon проводят более 100 A/B-тестов. После завершения этих экспериментов необходимо быстро и точно оценить влияние на ключевые бизнес-показатели: количество заказов, прибыль, конверсии и многие другие.
Десятки миллионов покупателей пользуются сайтом ежедневно, создавая огромный поток событий. Платформа отвечает за ежедневное вычисление порядка 1 млн значений метрик и различных статистических тестов для них.
Платформа включает в себя:
Платформу расчета метрик и статистических тестов.
Инструменты предварительного анализа метрик.
Систему аудита метрик (A/A-тесты).
Инструменты пост-анализа экспериментов.
Платформу корректного запуска A/B-тестов.
Система раннего оповещения.
KPI-монитор.
Airflow — для управления графами вычислений, обработка данных происходит в Apache Spark. Данные для расчётов берутся из HDFS, куда они агрегируются из разных источников: ClickHouse, PostgreSQL, Vertica. Рассчитанные метрики сохраняются в БД и отдаются наружу с помощью сервисов на Go.
Разрабатывать автоматизированную платформу расчета метрик и статистических тестов для всего Ozon.
Создавать и поддерживать различные платформенные инструменты для улучшения всего процесса проведения A/B-тестов.
Искать пути оптимизации текущих решений для поддержания постоянного и стабильного масштабирования системы и эффективного использования вычислительных ресурсов.
Развивать существующую архитектуру по интеграции новых источников данных от внешних команд.
Опыт разработки на Python от 2-х лет.
Опыт работы с Spark/Pyspark/Hadoop.
Понимание принципов обработки больших данных.
Знакомство с логическими моделями хранения данных, понимание зачем они нужны.
Опыт работы с Apache Iceberg, ClickHouse, Vertica.
Понимание теории вероятностей и статистики, базовых алгоритмов.
Желание разбираться в архитектуре приложений/систем, наши расчёты должны работать максимально точно, надёжно и быстро