Старший LLM-разработчик в команду Нейро

яндекс · 28 нояб.

Зарплата не указана

Нейро — это большой технологический проект, который объединяет LLM, LLM-агентов, ассистентов и поиск по веб-документам. С его помощью мы хотим построить поиск будущего — более умный, более глубокий, более полезный и более активный. Одно из важнейших свойств такой системы — достоверность ответов, которая подразумевает фактологическую точность и подтверждённость на основе данных из надёжных источников. Мы разрабатываем подходы, которые позволяют обеспечивать эти свойства в наших генеративных моделях, и ищем LLM-разработчика, который усилит это направление.

Создание и улучшение реворд-моделей

Для обучения генеративных моделей с помощью RL критически важно иметь хорошие реворды, которые умеют автоматически оценивать соответствие ответов требуемым свойствам. Мы обучаем дискриминативные и генеративные реворд-модели, используем все доступные современные методы для улучшения их качества: SFT, RL, ризонинг. Эта работа напрямую влияет на улучшение качества ответов для пользователей.

Обучение LLM-асессора

Мы стремимся сделать процесс оценки качества ответов более эффективным и точным. Вы будете работать над созданием LLM-агентов, которые будут помогать человеку с фактчекингом и разметкой данных, благодаря чему эти процессы станут быстрее, дешевле и даже качественнее.

Сжатие и удешевление LLM-асессора и реворд-моделей

Для обучения сильных LLM нужно большое количество данных, а значит, нам нужно запускать много процессов разметки и обучения. Вам предстоит экспериментировать с архитектурами и методами уменьшения моделей и ускорения инференса, чтобы все наши пайплайны сходились быстрее.

Подробнее про [Alice AI](https://ya.ru/ai/aliceai#section-llm)

* Знаете Python
* Хорошо разбираетесь в классических DL и NLP
* Решали NLP-задачи с использованием трансформеров
* Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт