
яндекс · 16 июн.
↑ Вакансия с автоподнятиемМы делаем сервис Нейро — новый способ поиска информации, который скоро может вытеснить привычную всем выдачу с синими ссылками. Подробнее читайте в статье на Хабре «Яндекс запустил Нейро. Рассказываем, как он работает».
Если коротко: генеративная нейросеть (LLM) на основе YandexGPT анализирует содержимое веб-страниц и отвечает на вопросы пользователя в чате. Чтобы обучать нейросети и измерять качество их работы, мы делаем проекты разметки ответов с помощью Yandex Crowd — внутреннего сервиса Яндекса. От успешности этих проектов прямо зависит развитие Нейро.
Чтобы лучше понять, как мы работаем с продуктом, можете посмотреть рассказ о разметках для Поиска на конференции DataDriven.
Если вы знаете аналитику, хорошо пишете код и делаете точные выводы на основе данных — приходите вместе с нами строить поиск будущего!
Формализация требований к качеству продукта
Наша основная задача — превратить плохо формализованное и противоречивое определение продукта в набор чётких правил и принципов, с помощью которых мы сможем обозначить конкретный ответ как хороший (подходящий для продукта) или плохой (ошибка в продукте) и обосновать такое решение. Сначала мы учимся делать это сами (собираем и обсуждаем примеры, пишем инструкции) — а затем обучаем этому AI-тренеров и асессоров.
Создание сложных проектов в Yandex Crowd
Для массового сбора разметки мы создаём иерархические проекты из нескольких уровней разметчиков. У каждой группы исполнителей свой метод обучения и свои требования к качеству. Мы запустили в 2023-м и продолжаем развивать несколько проектов, которые сильно отличаются от типовых сложностью и большими объёмами заданий.
Проверка подтверждённости ответов
Одна из самых важных задач — проверять подтверждённость ответов Нейро. Это значит, что ответ по смыслу следует содержанию источников (веб-страниц, на основе которых он написан): верно передаёт факты, не противоречит им, не врёт, не вводит пользователя в заблуждение. На практике это сложное задание анализа текста, и его качеством мы будем активно заниматься в ближайшие полгода.
* Въедливы, готовы до мелочей разбираться в том, как и почему должен работать продукт
* Умеете писать на Python и SQL
* Знаете математическую статистику и теорию вероятностей
* Умеете общаться в команде, ясно излагать мысли, понимать и убеждать коллег
* Самостоятельны и готовы браться за новые задачи, для которых нет готового решения
* Работали с Толокой или другими краудсорс-платформами
* Писали инструкции и самостоятельно запускали проекты разметки данных
У нас классно, потому что:
* Мы работаем с Нейро — новым продуктом Яндекса на основе LLM — и ориентированы прежде всего на результат в продакшене
* Наши задачи тесно связаны и с дизайном самого продукта, и с ML
* Мы даём возможность развивать как технические, так и коммуникативные и менеджерские навыки
* Ваша работа прямо повлияет на то, каким станет Нейро через полгода
* Мы делаем уникальные по сложности, масштабу и архитектуре краудсорс-проекты
* Наша слаженная команда аналитиков и ML-инженеров качества Поиска постоянно обсуждает задачи и обменивается опытом