Направление ML Ops — неотъемлемая часть инфраструктурных и продуктовых команд, которые участвуют в доставке ML-моделей в продакшен.
Один из центров экспертизы ML Ops в Т-Банке — команда ML Core Platform.
ML Core — передовая платформа для машинного обучения, которая ускоряет разработку и внедрение ML-моделей в бизнес-процессы. Мы добавляем в платформу инструменты, которые обеспечивают эффективную разработку, обучение и прототипирование моделей.
ML Core интегрирована с другими платформами и инструментами компании. Это позволяет нам внедрять и использовать модели в разных продуктах и сервисах: от информационной безопасности и рисков до голосовых технологий и R&D.
-
Разрабатывать и поддерживать ML-пайплайны дообучения моделей машинного обучения
-
Развертывать AI-модели: настраивать CI/CD для ML, автоматизировать выкатку моделей, контролировать версионирование, создавать отказоустойчивую и масштабируемую среду, строить ML-пайплайны с Apache Airflow для обработки данных и внедрять open source-модели в инфраструктуру компании
-
Проводить мониторинг и обслуживание AI-моделей
-
Управлять инфраструктурой в виде GPU-серверов
-
Разворачивать и поддерживать современные ML-инструменты
-
Документировать и стандартизировать практики вокруг обслуживания инфраструктуры для машинного обучения
-
Оптимизировать сервинг моделей: утилизация и виртуализация GPU, настройка GPU/CUDA-оптимизаций, конфигурирование сервинга для инференса, мониторинг работы моделей, алертинг
-
Создавать программные модули для обучения и обслуживания AI-моделей
-
Знаете Python или Go, умеете писать production-ready код
-
Работали с библиотеками для данных Pandas и NumPy, вели эксперименты — Jupyter, ClearML
-
Работали с хранилищами данных: S3, Postgres, Redis
-
Понимаете жизненный цикл ML-модели: обучение, валидация, переобучение
-
Знаете основные метрики качества моделей: AUC-ROC, Precision/Recall и другие
-
Работали с Docker и Kubernetes
-
Развертывали модели в продакшн: Triton, Seldon, BentoML или аналоги
-
Настраивали мониторинг инфраструктуры Grafana и Prometheus, и самих моделей
-
Умеете настраивать CI/CD пайплайны для ML: GitLab CI, AirFlow
-
Понимаете принципы Infrastructure as a Code, знаете Terraform или его аналоги
-
Работу в офисе или удаленно — по договоренности
-
Возможность работы в аккредитованной ИТ-компании
-
ДМС со стоматологией, включая чекапы, компенсацию покупки лекарств и льготные условия страхования для близких. Еще — страховка от несчастных случаев и болезней
-
Рост по карьерному треку: проходите курсы по софт- и хард-скиллам, развивайтесь с поддержкой ментора и повышайте уровень с матрицей компетенций и регулярным ревью
-
Сильное комьюнити. Вы будете работать с экспертами в своей области, сможете делиться знаниями и выступать на конференциях, посещать митапы и писать статьи
-
Онлайн-консультации с психологами, юристами, специалистами по финансам и здоровому образу жизни
-
Компенсацию затрат на спортивные абонементы, приложение Т-Спорта для онлайн-занятий и командные тренировки с коллегами
-
3 дополнительных дня к отпуску — можно использовать для отдыха или получить компенсацию
-
Специальные тарифы на продукты Т-Банка и широкую программу скидок от партнеров
-
Достойную зарплату — обсудим ее на собеседовании