H
HireSeeker
ozon

Старший Data Scientist, Алгоритмический биддинг"

ozon · Москва · 18 июн.

Зарплата не указана

Всем привет! Это команда Алгоритмический биддинг.

Наша команда разрабатывает алгоритмы монетизации рекламы в Ozon Ads и отвечает за высоконагруженную систему, которая управляет показами рекламы в поиске, каталоге, рекомендациях и на внешнем трафике.

Мы балансируем три цели:

  • релевантность рекламы для пользователей

  • эффективность для продавцов

  • устойчивый рост платформы

Сейчас у нас уже есть стабильные production bidding-контроллеры, и следующий шаг - перейти от ручных и эвристических стратегий к обучающимся политикам, которые оптимизируют решения во времени.

Мы ищем коллегу, который поможет нам развивать направление Reinforcement Learning и Sequential Decision Making в задачах биддинга и оптимизации аукциона.

Это роль на стыке: Машинного обучения × Оптимизации × Теории Аукционов.

Стек: Python, Jupyter, экосистема Hadoop (Spark, Yarn, Hive, HDFS), ClickHouse, Airflow, Superset, Grafana

Вам предстоит:

  • Развивать подходы на основе Reinforcement Learning для оптимизации рекламных-стратегий

  • Работать с уже существующими контроллерами и формировать путь их эволюции в обучающиеся политики

  • Проектировать reward функции для долгосрочной оптимизации метрик (CPA, ROAS, LTV)

  • Строить фреймворки для off-policy оценки и безопасного внедрения новых стратегий в продакшн

  • Анализировать trade-offs между exploration / exploitation в условиях аукциона и не стационарной среды

  • Проводить эксперименты и A/B тесты для проверки эффективности новых политик

  • Взаимодействовать с backend и ML инженерами для интеграции решений в продакшн-системы

Мы ожидаем:

  • 3+ года опыта в Data Science / Applied ML с production impact

  • Python + SQL + PySpark на уверенном уровне

  • Сильная база в математике, статистике и оптимизации

  • Опыт доведения ML-решений до прода

  • Интерес к decision-making systems, аукционам и оптимизации

  • Умение работать с неопределённостью и сложными системами

Будет плюсом:

  • Опыт с RL / bandits / sequential decision making

  • Опыт в RTB / DSP / SSP или рекламных аукционах

  • Понимание auction theory и pricing mechanisms

  • Опыт simulation / offline evaluation systems

  • MSc / PhD в CS, Math, Statistics или смежных областях

Мы предлагаем:

  • Динамичный и быстроразвивающийся бизнес, ресурсы, возможность сделать вместе лучший продукт на рынке e-commerce.

  • Свободу действий в принятии решений.

  • Достойный уровень заработной платы.

  • Профессиональную команду, которой мы гордимся.

  • Возможность развиваться вместе с нашим бизнесом.