
яндекс · 3 апр.
Наша команда занимается аналитикой базовой технологии, лежащей под капотом Алисы, Нейропоиска, Нейробраузера и многих других продуктов, — большой языковой модели Alice AI. Вот некоторые из наших рабочих вопросов:
* Как определить, с какими задачами модель справляется хорошо, а с какими — не очень?
* Какие данные добавить в finetune, чтобы обучить модель новой задаче?
* Откуда взять эти данные и как проконтролировать их качество?
* Как построить процесс краудсорсинговой разметки?
Давайте искать на них ответы вместе!
Развитие модели
В эту задачу входят проактивный поиск ошибок модели и исправление проблемных срезов, оценка эффективности изменений и последующее внедрение улучшений.
Формирование базы данных
Вы будете собирать данные для разработки и интеграции новых функций.
Обучение исполнителей
Вам предстоит подбирать и обучать квалифицированных исполнителей, разрабатывать для них систему мотивации, контролировать качество разметки и внедрять процессы для улучшения результатов.
Больше об аналитике в Яндексе — в канале Yandex for Analytics
* Любите работать с текстовыми данными
* Знаете математическую статистику и теорию вероятностей
* Умеете писать на Python и SQL
* Самостоятельны и готовы браться за новые задачи, для которых нет готового решения
* Работали с Толокой или другими краудсорс-платформами