H
HireSeeker
М

Middle+/Senior Data Scientist в Защитник [Big Data, МТС Веб Сервисы]

мтс · Москва · 14 июн.

Зарплата не указана

МТС Web Services (MWS) — бигтех-компания, предоставляющая облачные, AI-сервисы и платформенные решения под разные задачи бизнеса: от работы с данными до разработки продуктов и оптимизации процессов. Также мы запустили новую публичную платформу собственной разработки — MWS Cloud Platform.
Big Data – один из ключевых юнитов МТС.
Сегодня Big Data – это: 20 петабайт данных, 5 000 метрик на профиль и 400 увлеченных профессионалов в команде.
Мы – data-команда продукта МТС Защитник, который защищает миллионы пользователей от телефонного спама и мошенников. Это живая и постоянно меняющаяся задача: спамеры адаптируются под фильтры, меняют поведение и тексты, а мошенники регулярно придумывают новые схемы, используя социальную инженерию и давление на эмоции. Мы работаем с большими объёмами данных и моделями, которые должны не просто хорошо считать метрики, но и стабильно работать в продакшене с жёсткими требованиями к latency и качеству - и реально влиять на безопасность людей.
Поэтому мы ищем Middle+/Senior ML Engineer, который поможет нам в развитии инструментов борьбы со спамом и мошенниками.
Используемый стек ML: Python, CatBoost, PyTorch, Transformers, ONNX, Triton Inference Server, MLflow; Data: PySpark, ClickHouse, Pandas, NumPy

Задачи

Поддерживать и развивать ML-модели для выявления телефонного спама и мошенничества (табличные модели и NLP: классификация текстов, анализ расшифровок звонков);
Заниматься feature engineering, у нас много витрин и источников данных, важно извлекать из них полезные сигналы;
Участвовать в построении pipeline от данных до production-инференса (обучение, оптимизация, мониторинг);
Участвовать в постановке задач разметки и работе с качеством данных;
Общаться с бизнес-заказчиками: помогать формализовать задачи, согласовывать метрики, объяснять ограничения и результаты моделей;
Предлагать и проверять новые подходы к детектированию спама и мошеннических сценариев

Требования

Опыт работы в Data Science / ML от 3 лет;
Хорошее понимание классического ML и практический опыт feature engineering;
Опыт продуктивизации ML-моделей и их сопровождения;
Опыт в дообучении NLP-моделей под конкретные задачи: классификация, NER;
Умение переводить бизнес-задачи в ML-формулировки и внятно объяснять результаты;
Уверенные навыки Python и SQL;
Будет плюсом: PySpark, Hadoop, MLOps

Условия

Собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах;
Профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше;
Внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;
Участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch;
Полезные курсы и вебинары в корпоративном университете и электронную библиотеку;
ДМС с первого месяца работы, включая стоматологию;
Страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях;
Отпуск 28 календарных дней (+3 дополнительных дня за ненормированный рабочий день);
Гибридный формат работы;
Прием врачей общей практики и массаж в офисе;
Мобильная связь за счет компании и льготные тарифы для близких;
Подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.