H
HireSeeker
эр-телеком холдинг

Разработчик Python (ML)

эр-телеком холдинг · Пермь · 5 дней назад

Зарплата не указанаoffice
Открыть на hh.ru

Чем предстоит заниматься:

  • Участие в создании продуктов B2C в подразделении Movix Lab.
  • Разработка программных продуктов с применением ML.
  • Сопровождение и развитие существующих проектов: классификатор интентов, NER, поиск, сбор, очистка и версионирование датасетов, подготовка hard negatives/hard cases, анализ ошибок на пользовательских запросах.
  • Построение повторяемых train/eval/release-пайплайнов, ведение метрик, отчетов, regression-тестов и release checklist.
  • Поддержка model runtime: HTTP API, readiness, метрики, логи, мониторинг качества, интеграция с backend-сервисами.

Стэк технологий с которыми мы работаем:

  • Python: pandas, numpy, scikit-learn, PyTorch, Transformers, sentence-transformers.
  • CatBoost, Optuna, embeddings, ONNX, BM25/KNN, vector search.
  • NER/CRF, XLM-RoBERTa/RuBERT, нормализация сущностей, CSV-словари.
  • Flask/Hypercorn HTTP API, Prometheus, ClickHouse, логирование и health/readiness endpoints.
  • Docker, GitLab CI/CD, Manticore/Sphinx, интеграция с Java/Spring Boot сервисами.

Мы ждём от тебя:

  • Уверенную разработку на Python для ML/NLP-пайплайнов.
  • Знание алгоритмов, структур данных, математики, статистики и метрик качества ML-моделей.
  • Практический опыт обучения, дообучения и валидации моделей NLP: intent classification, NER, semantic search.
  • Опыт работы с embeddings, vector/KNN search, BM25/lexical features, CatBoost, Transformers/sentence-transformers.
  • Умение собирать и чистить датасеты, формировать hard negatives/hard cases, вести regression/evaluation reports.
  • Опыт разработки и сопровождения HTTP runtime-сервисов для моделей, логирования, метрик и мониторинга качества.
  • Умение анализировать ошибки на реальных пользовательских запросах и итеративно улучшать модель.
  • Опыт работы с Docker, CI/CD.
  • Понимание production lifecycle модели: подбор threshold, экспорт артефактов, rollback.

Будет плюсом:

  • Опыт внедрения ML/NLP-решений в production-системах.
  • Опыт работы с русскоязычными запросами в кинодомене: фильмы, сериалы, персоны, жанры, страны, даты.
  • Опыт экспорта моделей в Java/DJL runtime и понимание различий Python evaluation и production inference.
  • Опыт работы с GitLab CI/CD, ClickHouse, Prometheus, Manticore/Sphinx.
  • Опыт оптимизации inference: ONNX, кэширование, latency, CPU/GPU deployment.

Мы предлагаем:​​​​

  • Возможность присоединиться к профессиональной, высоко мотивированной и результативной команде, перспективы карьерного роста;
  • Официальное трудоустройство в аккредитованный IT-актив, оплачиваемые отпуск, командировки, больничные;
  • График работы офис;
  • Рыночную заработную плату по результатам собеседования;
  • ДМС со стоматологией после испытательного срока, 100% компенсацию больничного;
  • Комфортные офисные условия;
  • Корпоративные программы от наших партнеров;
  • Бонусное подключение к телеком-услугам Дом.ru по тарифу «Сотрудник»;
  • Яркую корпоративная жизнь и дружелюбную атмосферу в коллективе профессионалов!