Чем предстоит заниматься:
- Участие в создании продуктов B2C в подразделении Movix Lab.
- Разработка программных продуктов с применением ML.
- Сопровождение и развитие существующих проектов: классификатор интентов, NER, поиск, сбор, очистка и версионирование датасетов, подготовка hard negatives/hard cases, анализ ошибок на пользовательских запросах.
- Построение повторяемых train/eval/release-пайплайнов, ведение метрик, отчетов, regression-тестов и release checklist.
- Поддержка model runtime: HTTP API, readiness, метрики, логи, мониторинг качества, интеграция с backend-сервисами.
Стэк технологий с которыми мы работаем:
- Python: pandas, numpy, scikit-learn, PyTorch, Transformers, sentence-transformers.
- CatBoost, Optuna, embeddings, ONNX, BM25/KNN, vector search.
- NER/CRF, XLM-RoBERTa/RuBERT, нормализация сущностей, CSV-словари.
- Flask/Hypercorn HTTP API, Prometheus, ClickHouse, логирование и health/readiness endpoints.
- Docker, GitLab CI/CD, Manticore/Sphinx, интеграция с Java/Spring Boot сервисами.
Мы ждём от тебя:
- Уверенную разработку на Python для ML/NLP-пайплайнов.
- Знание алгоритмов, структур данных, математики, статистики и метрик качества ML-моделей.
- Практический опыт обучения, дообучения и валидации моделей NLP: intent classification, NER, semantic search.
- Опыт работы с embeddings, vector/KNN search, BM25/lexical features, CatBoost, Transformers/sentence-transformers.
- Умение собирать и чистить датасеты, формировать hard negatives/hard cases, вести regression/evaluation reports.
- Опыт разработки и сопровождения HTTP runtime-сервисов для моделей, логирования, метрик и мониторинга качества.
- Умение анализировать ошибки на реальных пользовательских запросах и итеративно улучшать модель.
- Опыт работы с Docker, CI/CD.
- Понимание production lifecycle модели: подбор threshold, экспорт артефактов, rollback.
Будет плюсом:
- Опыт внедрения ML/NLP-решений в production-системах.
- Опыт работы с русскоязычными запросами в кинодомене: фильмы, сериалы, персоны, жанры, страны, даты.
- Опыт экспорта моделей в Java/DJL runtime и понимание различий Python evaluation и production inference.
- Опыт работы с GitLab CI/CD, ClickHouse, Prometheus, Manticore/Sphinx.
- Опыт оптимизации inference: ONNX, кэширование, latency, CPU/GPU deployment.
Мы предлагаем:
- Возможность присоединиться к профессиональной, высоко мотивированной и результативной команде, перспективы карьерного роста;
- Официальное трудоустройство в аккредитованный IT-актив, оплачиваемые отпуск, командировки, больничные;
- График работы офис;
- Рыночную заработную плату по результатам собеседования;
- ДМС со стоматологией после испытательного срока, 100% компенсацию больничного;
- Комфортные офисные условия;
- Корпоративные программы от наших партнеров;
- Бонусное подключение к телеком-услугам Дом.ru по тарифу «Сотрудник»;
- Яркую корпоративная жизнь и дружелюбную атмосферу в коллективе профессионалов!