
яндекс · 28 нояб.
Нейро — это большой технологический проект, который объединяет LLM, LLM-агентов, ассистентов и поиск по веб-документам. С его помощью мы хотим построить поиск будущего — более умный, более глубокий, более полезный и более активный. Одно из важнейших свойств такой системы — достоверность ответов, которая подразумевает фактологическую точность и подтверждённость на основе данных из надёжных источников. Мы разрабатываем подходы, которые позволяют обеспечивать эти свойства в наших генеративных моделях, и ищем LLM-разработчика, который усилит это направление.
Создание и улучшение реворд-моделей
Для обучения генеративных моделей с помощью RL критически важно иметь хорошие реворды, которые умеют автоматически оценивать соответствие ответов требуемым свойствам. Мы обучаем дискриминативные и генеративные реворд-модели, используем все доступные современные методы для улучшения их качества: SFT, RL, ризонинг. Эта работа напрямую влияет на улучшение качества ответов для пользователей.
Обучение LLM-асессора
Мы стремимся сделать процесс оценки качества ответов более эффективным и точным. Вы будете работать над созданием LLM-агентов, которые будут помогать человеку с фактчекингом и разметкой данных, благодаря чему эти процессы станут быстрее, дешевле и даже качественнее.
Сжатие и удешевление LLM-асессора и реворд-моделей
Для обучения сильных LLM нужно большое количество данных, а значит, нам нужно запускать много процессов разметки и обучения. Вам предстоит экспериментировать с архитектурами и методами уменьшения моделей и ускорения инференса, чтобы все наши пайплайны сходились быстрее.
Подробнее про [Alice AI](https://ya.ru/ai/aliceai#section-llm)
* Знаете Python
* Хорошо разбираетесь в классических DL и NLP
* Решали NLP-задачи с использованием трансформеров
* Понимаете, как устроены современные LLM, решали с их помощью прикладные задачи или имеете релевантный исследовательский опыт