H
HireSeeker
яндекс

Разработчик на С++ в ОРД

яндекс · 14 июн.

↑ Вакансия с автоподнятием
Зарплата не указана

Яндекс ОРД (оператор рекламных данных) — это масштабная инфраструктура, разработанная для участников рынка интернет-рекламы и позволяющая выполнять требования закона о маркировке рекламы. Наш сервис обеспечивает проверку, надёжное хранение данных и их передачу в ЕРИР (Единый реестр интернет-рекламы).

Задача нашего проекта — сделать удобный инструмент как для внутренних рекламных систем Яндекса, так и для внешних агентств, паблишеров и других участников рекламного рынка.
Проекту ОРД всего один год — кодовая база новая, легаси-код отсутствует.

Развитие функциональности процессинга данных

Наш сервис находится в центре стремительно развивающегося рынка рекламных технологий. Инвестиции в инфраструктуру тут особенно важны. В ОРД вы сможете поработать с передовыми решениями стриминговой обработки данных в Яндексе. Мы планируем добавлять новые контуры обработки в архитектуру событийно-ориентированного сервиса.

Что предстоит делать:
* Разработать контур дедупликации объектов, поступающих от разных систем и пользователей
* Вместе с продуктовыми командами находить решения по маркировке для новых рекламных механик и продуктов
* Готовить и защищать свои решения на архитектурных ревью с командами разработки и аналитики

Развитие ОРД как продукта

На старте проекта приоритетом ОРД Яндекса была маркировка данных рекламной системы Яндекс Директа, которая создаёт более 200 млн запросов в день только на маркировку креативов. Теперь стремимся сделать ОРД более доступным и удобным для широкого круга пользователей.

Что предстоит делать:
* Вместе с командой UI развивать бэкенд пользовательского интерфейса
* Анализировать трудности клиентов и упрощать внесение и исправление данных

Оптимизация, масштабирование контуров обработки данных

Маркировка обязательна для всей рекламной инфраструктуры Яндекса, поэтому стабильность сервиса критически важна. Каждый день мы получаем, обрабатываем и отправляем сотни миллионов объектов. Важно обеспечить высокую горизонтальную масштабируемость во всех частях системы.

Что предстоит делать:
* Развивать системы мониторинга, реализовывать и совершенствовать практики инцидент-менеджмента
* Развивать систему шардирования источников данных. Объекты, связанные бизнес-логикой, должен обрабатывать один процесс, причём в правильном порядке. При этом нужно достичь максимальной параллельности, чтобы минимизировать задержки
* Находить в обработке узкие места и убирать их с критического пути объекта. Пример: перенос обработки видео и изображений креативов в отдельный контур
* Автоматизировать перемещение данных из горячего в холодное хранилище. ОРД хранит данные годами, при этом пользователям нужно небольшое подмножество активных документов — хранить все одинаково доступными будет неэффективно

* Знакомы с классическими алгоритмами и структурами данных
* Аккуратны и внимательны к деталям
* Отлично знаете С++ и STL
* Владеете языком запросов SQL
* Работали с реляционными и нереляционными базами данных

* Разрабатывали высоконагруженные распределённые системы
* Знакомы с системами очередей (Kafka, RabbitMQ)
* Стремитесь к оптимальному и лаконичному коду
* Администрировали ОС Linux и сети