
яндекс · 29 мая
Мы в команде функций Алисы разрабатываем LLM, которая способна работать с сотнями различных инструментов. Это позволяет делать Алису умнее и работать во множестве сложных сценариев: продуктивности, управлении умным домом, поиске контента, погоде и много где ещё!
Чем мы занимаемся
* Исследуем подходы к улучшению качества в tool-calling-сценариях
* Совершенствуем SFT-стадию
* Делаем RL
* Расширяем возможности Алисы для миллионов пользователей
С видеокартами мы уже разобрались, так что ищем крутых коллег, с которыми построим по-настоящему умного ассистента.
Разработка и внедрение в устройства с Алисой новых сценариев на базе LLM
Вы будете обучать LLM решать задачи пользователя в сложных сценариях, которые возникают при взаимодействии с устройствами и умным домом. Предстоит совершенствовать выбор необходимых функций, улучшать способности LLM работать со сложным контекстом и вызывать цепочки функций для решения задачи пользователя, создавать для этого RL-среды и подходы к генерации данных.
Замена традиционных классификаторов LLM-пайплайнами и RAG-системами
Вы будете трансформировать существующие архитектуры в современные пайплайны с LLM, вызовом функций, планированием и рассуждениями.
Дообучение, настройка и интеграция моделей, оптимизация inference
Вам предстоит работать как с опенсорс-моделями, так и с внутренними, включая fine-tuning, RL и адаптацию под платформу Алисы. Нужно обеспечить быструю и устойчивую работу моделей на проде, включая оптимизацию inference и взаимодействие с инфраструктурой (Eagle, FP8, дистилляцию, etc.).
Участие в разработке RL-моделей для обучения диалоговых агентов
Если у вас есть опыт работы с multi-turn reinforcement learning или интерес к нему, можно будет погрузиться в постановку и реализацию таких экспериментов в масштабах Яндекса и Алисы с сотнями тулов и большим количеством тёрнов.
Работа в большой кросс-функциональной команде
Делать Алису лучше нам помогает большая команда, состоящая из аналитики, бэкенда и продукта. Вам предстоит строить взаимодействия, прорабатывать системы бенчмаркинга моделей совместно с аналитикой и обсуждать варианты реализаций функций, подходящих для LLM-пайплайнов.
Больше об ML в Яндексе — в канале Yandex for ML
* Обладаете глубокими знаниями в Deep Learning и NLP
* Работали с LLM и пайплайнами вокруг них (function calling, memory, RAG)
* Внедряли ML-системы в продакшен
* Мыслите системно — от архитектуры до интеграции с инфраструктурой
* Пишете на Python, знакомы с PyTorch
* Готовы к кросс-функциональной работе с бэкендом, аналитикой и продуктовыми командами