Сейчас подключены несколько поставщиков: напрямую некоторые отели, а также агрегаторы, которые предоставляют данные по датам, ценам и условиям бронирования.
Многие поставщики предоставляют информацию по одной и той же комнате. Необходимо осуществлять матчинг этих данных, чтобы показывать клиенту наиболее выгодное предложение. УТП сервиса — самая низкая цена + кэшбэк, что действительно создаёт выгоду для клиентов.
На данный момент задачу матчинга комнат решают, основываясь на частичном названии, описании и галерее с изображениями. Процесс работает в связке с краудсорсингом. В зависимости от условий принимается решение: матчинг, отсутствие матчинга или передача на краудсорсинг.
Также появился новый стрим — матчинг апартаментов. Здесь другие поставщики, другие форматы данных. Если для отелей уже существует схема матчинга комнат, то для апартаментов требуется построить новую систему матчинга и привести к ней существующую.
Сейчас система работает на базе одной модели NLP. Планируется подключить дополнительные сигналы от CV. Уже есть модель, которую нужно дообучать. Появится второй сигнал — по изображениям. Необходимо научиться балансировать между NLP и CV, добавлять новые фичи, увеличивать их количество и улучшать качество матчинга.
Смотрим ребят только из NLP, здорово, если есть опыт с CL ML/CV и готовность ими заниматься.
-
Улучшать качество NLP-моделей в разных сценариях
-
Ускорять работу моделей, применять современные методы оптимизации и построения архитектуры
-
Писать воспроизводимый код, оформлять эксперименты в воспроизводимые пайплайны, которые включают разметку и обработку данных, обучение моделей и валидацию системы в целом
-
Изучать научные статьи, генерировать гипотезы, ставить на их основе эксперименты и доносить результат до команды
-
У вас есть опыт работы в роли ML-разработчика в NLP-домене с использованием современных DL-фреймворков от 2 лет
-
Строили продукты для конечных пользователей: проводили поиск, создавали чат-боты и рекомендательные системы, где ML обеспечивал ключевую функциональность
-
Разбираетесь в NLP и DL: понимаете алгоритмы, умеете выбирать подход под задачу, оценивать качество, работать с данными, метриками и деградациями
-
Умеете строить NLP-решения в продакшене: пайплайны, мониторинг, деградации, A/B-тесты
-
Владеете Python, FastAPI, Pandas, SQL
-
Знаете Linux, Git, Bash и Docker
-
Погружены в современный подход к обучению больших языковых моделей
-
Знаете RAG-фреймворки, search-eval-подходы
-
Знакомы с современными методами preference optimization: DPO, GRPO
-
Будет плюсом опыт реализации онлайн- и офлайн-RL-методов для LLM
-
Работу в офисе или гибридный формат — по договоренности с руководителем
-
Возможность работы в аккредитованной ИТ-компании
-
ДМС со стоматологией, включая чекапы, компенсацию покупки лекарств и льготные условия страхования для близких. Еще — страховка от несчастных случаев и болезней
-
Рост по карьерному треку: проходите курсы по софт- и хард-скиллам, развивайтесь с поддержкой ментора и повышайте уровень с матрицей компетенций и регулярным ревью
-
Сильное комьюнити. Вы будете работать с экспертами в своей области, сможете делиться знаниями и выступать на конференциях, посещать митапы и писать статьи
-
Онлайн-консультации с психологами, юристами, специалистами по финансам и здоровому образу жизни
-
Компенсацию затрат на спортивные абонементы, приложение Т-Спорта для онлайн-занятий и командные тренировки с коллегами
-
Три дополнительных дня к отпуску — можно использовать для отдыха или получить компенсацию
-
Специальные тарифы на продукты Т-Банка и широкую программу скидок от партнеров
-
Достойную зарплату — обсудим ее на собеседовании