
яндекс · 4 июн.
Ищем опытного NLP-разработчика, готового много экспериментировать как с базовым качеством обучения, так и с проработкой продуктовой функциональности.
Помимо продуктов, мы любим ресёрч и активно им занимаемся: за последние два года опубликовали три статьи на конференциях уровня A*, а наша система перевода регулярно попадает в топ лучших систем крупнейшего соревнования WMT.
Подробнее о наших исследованиях можно почитать в статье на [«Хабре»](https://habr.com/ru/companies/yandex/articles/884416/) и двух статьях с недавних конференций — [первая](https://aclanthology.org/2025.findings-emnlp.1203.pdf), [вторая](https://www2.statmt.org/wmt25/pdf/2025.wmt-1.50.pdf).
Построение ML-архитектуры системы
Вам предстоит прорабатывать и улучшать ML-функциональность системы, экспериментировать с обучением агентов под отдельные задачи, объединять различные ветки экспериментов в общий core-пайплайн и доводить улучшения до продакшена.
Обучение продвинутых лингвистических инструментов
Система репетитора, которой захочется пользоваться, должна уметь многое и на уровне мельчайшей детализации — очень точно оценивать отдельные ошибки студента, извлекать из них систематические недочёты и пробелы, систематизировать их в конкретный план обучения. Вы будете строить лингвистические инструменты на основе современных LLM и доводить их до качества state-of-the-art.
Поиск баланса между базовым качеством и продуктовой функциональностью
Вы будете принимать активное участие в разработке разных частей пайплайна — как связанных с базовым качеством, так и с разработкой новых продуктовых возможностей. Вместе с коллегами вам предстоит находить баланс между скоростью интеграции новых фич и достижением отличного качества работы существующих сценариев.
Больше об ML в Яндексе — в канале Yandex for ML
* Больше трёх лет работаете в области NLP
* Знакомы с современными техниками обучения LLM
* Отлично знаете математику, можете читать современные научные статьи и разбираться в них
* Любите иностранные языки и готовы анализировать много прототипов вместе с командами аналитиков и лингвистов