NLP разработчик Функций в Алису

яндекс · 29 мая

Зарплата не указана

Мы в команде функций Алисы разрабатываем LLM, которая способна работать с сотнями различных инструментов. Это позволяет делать Алису умнее и работать во множестве сложных сценариев: продуктивности, управлении умным домом, поиске контента, погоде и много где ещё!

Чем мы занимаемся
* Исследуем подходы к улучшению качества в tool-calling-сценариях
* Совершенствуем SFT-стадию
* Делаем RL
* Расширяем возможности Алисы для миллионов пользователей

С видеокартами мы уже разобрались, так что ищем крутых коллег, с которыми построим по-настоящему умного ассистента.

Разработка и внедрение в устройства с Алисой новых сценариев на базе LLM

Вы будете обучать LLM решать задачи пользователя в сложных сценариях, которые возникают при взаимодействии с устройствами и умным домом. Предстоит совершенствовать выбор необходимых функций, улучшать способности LLM работать со сложным контекстом и вызывать цепочки функций для решения задачи пользователя, создавать для этого RL-среды и подходы к генерации данных.

Замена традиционных классификаторов LLM-пайплайнами и RAG-системами

Вы будете трансформировать существующие архитектуры в современные пайплайны с LLM, вызовом функций, планированием и рассуждениями.

Дообучение, настройка и интеграция моделей, оптимизация inference

Вам предстоит работать как с опенсорс-моделями, так и с внутренними, включая fine-tuning, RL и адаптацию под платформу Алисы. Нужно обеспечить быструю и устойчивую работу моделей на проде, включая оптимизацию inference и взаимодействие с инфраструктурой (Eagle, FP8, дистилляцию, etc.).

Участие в разработке RL-моделей для обучения диалоговых агентов

Если у вас есть опыт работы с multi-turn reinforcement learning или интерес к нему, можно будет погрузиться в постановку и реализацию таких экспериментов в масштабах Яндекса и Алисы с сотнями тулов и большим количеством тёрнов.

Работа в большой кросс-функциональной команде

Делать Алису лучше нам помогает большая команда, состоящая из аналитики, бэкенда и продукта. Вам предстоит строить взаимодействия, прорабатывать системы бенчмаркинга моделей совместно с аналитикой и обсуждать варианты реализаций функций, подходящих для LLM-пайплайнов.

Больше об ML в Яндексе — в канале Yandex for ML

* Обладаете глубокими знаниями в Deep Learning и NLP
* Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
* Внедряли ML-системы в продакшен
* Мыслите системно — от архитектуры до интеграции с инфраструктурой
* Пишете на Python, знакомы с PyTorch
* Готовы к кросс-функциональной работе с бэкендом, аналитикой и продуктовыми командами