H
HireSeeker
яндекс

ML-разработчик в команду образования Alice AI VLM

яндекс · 10 июн.

Зарплата не указана

Наша команда развивает навыки решения STEM-задач в Alice AI VLM — мультимодальной модели, которую только в Алисе используют уже миллионы. Мы не боимся трогать pretrain, плотно занимаемся разработкой RL-подходов, в том числе для развития reasoning-способностей модели.
Нам важно создавать технологию, которая будет полезна для продукта: учить модель строить решения, понятные для пользователей и потребляющие при этом минимальное количество токенов.

Приходите к нам, если хотите решать самые интересные и сложные задачи индустрии для продукта с многомиллионной аудиторией.

Строить сложные reward-функции

Мы не ограничиваемся RLVR для проверки качества ответа, а экспериментируем с масштабируемыми reward-функциями, которые учитывают разные особенности и элементы ответов. Вам предстоит решать вопросы качества и скорости обучения, бороться с reward hacking.

Развивать базовую умность модели

STEM в мультимодальности — это не только про знание теоремы Пифагора или решение задач. Это про понимание сцены на изображении (различные электрические схемы, геометрические рисунки и т. д.) и знание графических концептов.

Создавать новые датасеты

Одно дело решать текстовые задачи, а другое — когда всё условие (или его часть) находится на изображении. Для создания мультимодальных датасетов нужны многоступенчатые пайплайны, учитывающие разнообразие и сложность тематик. Вам предстоит создавать такие пайплайны и строить качественные датасеты.

Развивать направление вширь

Наша команда уделяет много времени Alice AI. Вместе с нами трудится сильнейшая команда разработчиков бэкенда и фронтенда, аналитиков продукта и контроля качества, продуктовых менеджеров. В такой коллаборации часто рождаются новые инсайты и выявляются точки роста, которые можно превратить в задачи и довести до реализации.

Больше об ML в Яндексе — в канале Yandex for ML

* Горите темой больших мультимодальных или языковых моделей, занимались их обучением
* Хорошо знаете NLP/CV и следите за трендами в LLM/VLM
* Умеете решать ML-задачи полного цикла: от сбора разметки до внедрения в продакшен