ML-разработчик в области обработки естественного языка в Т- Путешествия

т-банк · 12 июн.

Зарплата не указана

Сейчас подключены несколько поставщиков: напрямую некоторые отели, а также агрегаторы, которые предоставляют данные по датам, ценам и условиям бронирования.

Многие поставщики предоставляют информацию по одной и той же комнате. Необходимо осуществлять матчинг этих данных, чтобы показывать клиенту наиболее выгодное предложение. УТП сервиса — самая низкая цена + кэшбэк, что действительно создаёт выгоду для клиентов.

На данный момент задачу матчинга комнат решают, основываясь на частичном названии, описании и галерее с изображениями. Процесс работает в связке с краудсорсингом. В зависимости от условий принимается решение: матчинг, отсутствие матчинга или передача на краудсорсинг.

Также появился новый стрим — матчинг апартаментов. Здесь другие поставщики, другие форматы данных. Если для отелей уже существует схема матчинга комнат, то для апартаментов требуется построить новую систему матчинга и привести к ней существующую.

Сейчас система работает на базе одной модели NLP. Планируется подключить дополнительные сигналы от CV. Уже есть модель, которую нужно дообучать. Появится второй сигнал — по изображениям. Необходимо научиться балансировать между NLP и CV, добавлять новые фичи, увеличивать их количество и улучшать качество матчинга.

Смотрим ребят только из NLP, здорово, если есть опыт с CL ML/CV и готовность ими заниматься.

Улучшать качество NLP-моделей в разных сценариях
Ускорять работу моделей, применять современные методы оптимизации и построения архитектуры
Писать воспроизводимый код, оформлять эксперименты в воспроизводимые пайплайны, которые включают разметку и обработку данных, обучение моделей и валидацию системы в целом
Изучать научные статьи, генерировать гипотезы, ставить на их основе эксперименты и доносить результат до команды

У вас есть опыт работы в роли ML-разработчика в NLP-домене с использованием современных DL-фреймворков от 2 лет
Строили продукты для конечных пользователей: проводили поиск, создавали чат-боты и рекомендательные системы, где ML обеспечивал ключевую функциональность
Разбираетесь в NLP и DL: понимаете алгоритмы, умеете выбирать подход под задачу, оценивать качество, работать с данными, метриками и деградациями
Умеете строить NLP-решения в продакшене: пайплайны, мониторинг, деградации, A/B-тесты
Владеете Python, FastAPI, Pandas, SQL
Знаете Linux, Git, Bash и Docker
Погружены в современный подход к обучению больших языковых моделей
Знаете RAG-фреймворки, search-eval-подходы
Знакомы с современными методами preference optimization: DPO, GRPO
Будет плюсом опыт реализации онлайн- и офлайн-RL-методов для LLM

Работу в офисе или гибридный формат — по договоренности с руководителем
Возможность работы в аккредитованной ИТ-компании
ДМС со стоматологией, включая чекапы, компенсацию покупки лекарств и льготные условия страхования для близких. Еще — страховка от несчастных случаев и болезней
Рост по карьерному треку: проходите курсы по софт- и хард-скиллам, развивайтесь с поддержкой ментора и повышайте уровень с матрицей компетенций и регулярным ревью
Сильное комьюнити. Вы будете работать с экспертами в своей области, сможете делиться знаниями и выступать на конференциях, посещать митапы и писать статьи
Онлайн-консультации с психологами, юристами, специалистами по финансам и здоровому образу жизни
Компенсацию затрат на спортивные абонементы, приложение Т-Спорта для онлайн-занятий и командные тренировки с коллегами
Три дополнительных дня к отпуску — можно использовать для отдыха или получить компенсацию
Специальные тарифы на продукты Т-Банка и широкую программу скидок от партнеров
Достойную зарплату — обсудим ее на собеседовании