ML-разработчик в Еду

яндекс · 3 апр.

Зарплата не указана

Яндекс Еда — динамично развивающийся сервис, предоставляющий услуги по доставке еды из ресторанов и магазинов миллионам пользователей в более чем 10 странах на разных континентах.

Наша команда управляет алгоритмической и ML-составляющей для ранжирования в клиентском продукте Еды. Мы разрабатываем персональные рекомендации, улучшаем поиск, развиваем новые пользовательские продуктовые сценарии, а также помогаем запускать ранжирование для новых стран и активно внедряем как классические методы машинного обучения, так и передовые нейросетевые разработки для улучшения качества ранжирования в Еде.

**Подробнее о том, чем мы занимаемся:**

ML в Екоме Яндекса: как работает и кто им занимается?

В группе алгоритмов рекомендаций пока шесть ML-разработчиков, но мы расширяемся и ищем новых людей в команду.

У нас хорошо отлажены внутренние процессы взаимодействия и минимум бюрократии.
Мы решаем сложные задачи на стыке продуктовой разработки и алгоритмов, наши внедрения напрямую влияют на бизнес и продукт Еды.

Примеры проектов, над которыми вам предстоит работать:

1. Переход на сквозное ранжирование и CPA-аукцион в рекламе

В Еде рекламный аукцион долго работал по CPC-модели (cost per click — партнёр платил за клик по ресторану, когда тот поднимался в топ выдачи за счёт рекламы). Под рекламу отводилось четыре места на самом верху выдачи, и чем выше ставку ставил партнёр, тем выше у него была вероятность попасть в топ.

Совсем недавно мы перешли на CPA-аукцион (cost per action — когда партнёр платит за заказ в том случае, если его ресторан был поднят рекламой в выдаче). Мы сделали механику, при которой органическая выдача смешивается с рекламной, а за счёт ставки у партнёра есть возможность подняться выше органических ресторанов. Для этого нам пришлось перейти от предсказания релевантности к предсказанию вероятности заказа и его маржинальности, а также на симуляциях подобрать оптимальные коэффициенты замешивания рекламы и органики. В дальнейшем планируем применить байесовскую оптимизацию для более оптимального подбора коэффициентов замешивания, перейти на другие таргеты в ранжировании и ещё много всего интересного.

2. Запуск ML-ранжирования в «Куда сходить»

«Куда сходить» — новый продукт в Еде, позволяющий пользователям выбрать ресторан, который можно посетить вживую, если доставка уже приелась. Для запуска нам потребовалось решить задачу колд-старта, для этого мы на основе данных из Яндекс Крипты подготовили DSSM-модель, способную генерировать LaL-векторы для пользователей и ресторанов, а также проделали большую инфраструктурную работу по подготовке логики расчёта фич и их логирования, чтобы в дальнейшем перейти к целевой схеме — ранжированию CatBoost.

Сейчас в «Куда сходить» мы внедряем коллаборативные модели SLIM и iALS, в дальнейшем планируем извлечь пользу из новых источников данных, перейти на новые таргеты, а также улучшить ранжирование в поиске.

3. Улучшение апсейла в ритейле

Апсейл — это рекомендательная лента с товарами на корзине магазинов. Мы проделали большую работу по улучшению алгоритмов рекомендаций на этой поверхности: внедрили mixigen (модель, определяющую, из каких источников нужно набирать кандидатов для ранжирования), добавили множество персональных факторов, внедрили userbody (большую двухбашенную модель, созданную в недрах Большого Поиска Яндекса). В дальнейшем планируем персонализировать mixigen, поработать над улучшением продуктовых механик, добавить новые источники кандидатов.

Узнайте про разработку городских сервисов Яндекса на dev.go.yandex

Ответственность за все стадии ML-проектов

Вам предстоит участвовать в проработке решений на основе машинного обучения для улучшения ранжирования, помогать сводить бизнес-требования к ML-задаче, разрабатывать и валидировать корректность работы ML-пайплайнов.

Улучшение продукта и проверка гипотез в A/B-экспериментах

Вы будете искать точки роста в продукте, предлагать и отстаивать идеи по его улучшению с помощью ML-ранжирования. Вам предстоит проверять ваши идеи в ходе A/B-экспериментов, анализировать их и защищать результаты.

Написание кода в продакшн

Наши модели работают в реал-тайм-сервисах, обрабатывающих сотни запросов в секунду. Вам предстоит писать продакшн-код на C++, тестировать и при необходимости оптимизировать его.

Взаимодействие со смежными командами

Великие дела не делаются поодиночке, поэтому вам предстоит работать в большой кросс-функциональной команде, где есть аналитики, разработчики, ML-специалисты и менеджеры. Вы будете тесно взаимодействовать со смежными командами для совместного движения вперёд.

* Разрабатывали на Python, C++ или других объектно-ориентированных языках программирования
* Хорошо знаете и применяли методы анализа данных и ML
* Знаете математическую статистику и теорию вероятностей
* Готовы разрабатывать полный цикл внедрения ML-решений: от обработки данных до внедрения в продакшн

* Внедряли ML-модели в продакшн
* Разрабатывали рекомендательные системы или поиск
* Работали с высоконагруженными реал-тайм-системами
* Разрабатывали бэкенд-сервисы на C++, Java, Go, C#