ML-разработчик в Карты

яндекс · 16 июн.

↑ Вакансия с автоподнятием

Зарплата не указана

Наша команда занимается машинным обучением в Яндекс Картах. Мы помогаем пользователям находить места, куда они хотят добраться, и выбирать, где провести время. Также мы работаем с пользовательским контентом, например с отзывами и фотографиями, чтобы показывать ключевые особенности организаций. А ещё мы оцифровываем реальный мир: автоматически собираем карту из спутниковых снимков, панорам и фотографий.

С помощью ML мы стремимся сделать наши подходы масштабируемыми и решить задачи, которые раньше были под силу только человеку. Например, советовать хорошие места по очень сложным запросам или автоматически описывать интересующее пользователя место.

В нашей команде проводят разработку full stack — от идеи решения задачи до внедрения в продакшен. Мы разбираем проблемы в ответах моделей, проверяем работоспособность методов, изучая офлайн- и онлайн-метрики качества, имплементируем обученную модель для работы в рантайме или в регулярном пайплайне.

Наш стек: Python, С++, CatBoost, BERT, YaLM (Зелибоба), YandexGPT, YTsaurus, модели сегментации, детекции, векторизации и NeRF для CV-задач.

https://yandex.ru/project/vacancies/ml_analytics_maps

Качество поиска

Как найти магазины, в которых можно купить редкую деталь для автомобиля? В каком салоне красоты по-особому красят волосы? Отвечать на подобные вопросы не так просто, а для ML-разработчика в нашей команде это отдельный вызов. Мы улучшаем качество ответов поиска по сложным запросам, опираясь на всю известную нам информацию об организации, включая отзывы, фотографии, сайты и информацию о меню и услугах.

Выбор мест и персонализация

Мы запустили в Картах новый режим «Идеи». В нём предлагаем пользователям, куда сходить и чем заняться, и рассказываем про эти места, суммаризируя с помощью YandexGPT и моделей компьютерного зрения массивы информации про каждое место. Наша команда работает над качеством рекомендаций, чтобы подобранные организации как можно лучше соответствовали желаниям пользователя.

Большие языковые модели для обучения других нейросетей

Мы используем множество асессорских разметок для обучения моделей. Один из способов повысить эффективность асессоров и полезность данных для обучения — отдавать на разметку людям только сложные случаи, а для простых решений применять тяжёлые LLM. Наша команда повышает эффективность сбора разметок и общее качество данных для обучения, применяя YandexGPT, чтобы в конечном счёте улучшить опыт пользователя, предложив более точное ранжирование в поиске, более подходящие подсказки и описания мест.

* Хорошо понимаете принципы классического ML, RecSys, NLP или CV
* Знаете С++, Python или другой язык программирования
* Разбираетесь в базовых алгоритмах и структурах данных