Разработчик на С++ в Ecom-cценарии

яндекс · 27 февр.

Зарплата не указана

Ecom-сценарии — это новый подход к выбору товаров в интернете на основе ML и AI. Пользователь может сгенерировать самые разные сценарии, которые помогут быстро и удобно найти нужное, сравнить предложения между собой, посмотреть плюсы и минусы, увидеть выгодные цены и способы покупки.

Мы создаём самую большую товарную базу в рунете и стремимся перевести поиск по товарам на новый уровень, оптимизировать его, сократив время обработки запроса и потребляемую память в несколько раз. У нас множество архитектурных и алгоритмических задач: разработка инфраструктуры доставки данных, высоконагруженный рантайм, продуктовая функциональность и аналитика. Наша работа помогает сотням тысяч пользователей и нацелена на результат, который можно измерить в реальной прибыли компании.

Наша команда быстро растёт, у нас много олимпиадников и ребят из Школы анализа данных. Мы умеем не только круто работать, но и отдыхать, организуем совместные выезды в разные города. Регулярно рассказываем про наши запуски и технологии на больших конференциях и митапах:
* HighLoad: как достать всё что угодно со всего интернета
* HighLoad: как эффективно ранжировать весь товарный рунет
* ML Party в Белграде

Развитие контент-системы

Контент-система — сердце всего сервиса. Она должна хранить миллиарды документов и уметь очень быстро их обрабатывать. Пример одной из наших недавних задач: интегрировать склейку оферов к SKU в контент-систему. Такие задачи подходят тем, кто на «ты» с С++, хочет разбираться в архитектуре сложных систем и готов учиться новому.

Масштабирование сервиса

Мы стартовали с базы в сотни миллионов документов, а сейчас в поисковом индексе их больше миллиарда. Путь к такой трансформации был нелёгким: потребовалось переписать несколько неэффективных мест, перейти на дружелюбные к SSD структуры данных, вынести ряд данных в отдельные микросервисы для горизонтального масштабирования. Сейчас есть продуктовый запрос в отдельных поверхностях держать на порядок больше документов. Для экспертов низкоуровневого программирования, любителей хорошо настраивать сетевые запросы и писать многопоточку у нас найдётся много интересных задач.

Развитие контента на стыке с ML

Контент офера (картинки, описание, характеристики, видео) — ключевой параметр наравне с ценой, на основе которого пользователь принимает решение о покупке. Нам нужно научиться показывать такой контент непосредственно от продавцов. Надо обучить несколько сильных моделей, которые будут понимать качество контента, оценивать его этичность и выбирать лучший (например, самый конверсионный) вид контента для конкретного офера. Предстоит много работать с данными, общаться с аналитиками и экспериментировать.

Больше о бэкенде в Яндексе — в канале Yandex for Backend

* Уверенно владеете C++ или готовы на него перейти
* Знаете классические алгоритмы и структуры данных
* Ориентированы на создание конечного продукта высокого качества
* Не боитесь сложных задач

* Работали с ML или готовы развиваться в этом направлении
* Проектировали распределённые системы, которые могут держать десятки тысяч RPS