Старший LLM-разработчик в Нейро

яндекс · 28 нояб.

Зарплата не указана

Мы развиваем Нейро — систему моделей для построения ответов LLM с использованием поиска как источника информации и обогащений ответа. Мы внедрили такую систему в Поиск Яндекса и сейчас стоим перед новым вызовом: научиться решать сложные сценарии с использованием Поиска, которые возникают в чате с Алисой.

Представьте запрос «составь план путешествия, чтобы увидеть косаток летом». Чтобы построить хороший ответ на него, нужны многостадийный поиск, использование картинок и данных от отелей, хорошая структура и высокая достоверность. И таких запросов — сотни тысяч из разных аспектов.

Наша команда отвечает за Align-модели Нейро: обучает SFT, исследует самые новые алгоритмы RL, максимизирует реворды, внедряет длинные контексты и MoE. Также важна часть с оптимизациями моделей: Нейро используют десятки миллионов человек, и чтобы держать такую нагрузку, нужно постоянно искать и внедрять новые методы оптимизации. Сейчас перед нами стоят новые вызовы, и мы ищем в команду сильного DL-разработчика, знающего LLM и умеющего писать код.

Исследование подходов RL

Так как Нейро должен не только писать тексты, но и использовать картинки, видео, подходящую структуру, мы используем десятки реворд-моделей для оптимизации разных аспектов. Сейчас наши основные методы — DPO и CE-RL, но они несовершенны, и мы хотим обучаться эффективнее. Нужно будет читать статьи, реализовывать новые методы, а также совершенствовать текущие.

Оптимизации моделей

Раскатка Нейро на миллионы пользователей — это очень дорого, а когда речь начинает идти о многостадийных поисках, то числа становятся совсем заоблачными. Нужно исследовать, реализовывать и иногда дебажить квантования, дистилляции, спекдеки. А потом внедрять их без потерь качества.

Поиск новых направлений

Когда делаешь новый продукт, возникает множество челленджей, и важно среди них находить точки роста, которые потом конвертируются в задачи. Например, нам не хватает более длинного контекста, не хватает умения «видеть» картинки. Когда такая точка роста находится, нужно превратить её в задачу, договориться со смежниками про совместные действия и довести эту задачу до конца в вопросах не только разработки, но и менеджмента. Такие задачи отлично помогают расти в сторону лида или техлида, и возникают они регулярно.

Подробнее про Alice AI

Больше об ML в Яндексе — в канале Yandex for ML

* Понимаете, как устроены LLM, как они обучаются и какие у них степени свободы
* Знаете классические DL и ML
* Пишете код на Python
* Читаете статьи, готовы к сложным вызовам и амбициозным задачам

* Работали с RL
* Реализовывали методы оптимизации или продакшн-инференса моделей