
сбер. it · Москва · 5 дней назад
Мы - команда платформы обучения моделей, отвечаем за автоматизацию процессов подготовки данных, проведения экспериментов, базовые инструменты, инфраструктуру и автоматику, которая снимает головную боль с наших инженеров и помогает им двигаться быстрее.
управлением командой (найм, 1-1, мотивация и тп)
постановка задач, операционное ревью и квартальных целей
разворачиванием, предоставлением, поддержкой и развитием инфраструктуры ML-платформы
интеграцией инструментов и с инфраструктурой и окружениями проведения экспериментов и подготовки данных
мониторингом и обеспечением бесперебойной работы ML-платформы
мониторингом и оценкой утилизации аппаратных ресурсов и машинерией для реализации fair-share механизмов.
опыт управления командой от 5 человек от 3 лет (найм, целеполагание, управление конфликтами, планирование, операционка)
опыт использования и работы с: Linux, bash, Python3, pytest, SQL, Kubernetes, Grafana, VictoriaMetrics, OTLP, ELK, Moira и тп
опыт использования LLM стека инструментов: vLLM, SGLang, FSDP, Ray, TRL, NeMO, W&B, SLURM, RLI, Verl, Lustre и тп;
умение разворачивать, настраивать, мониторить необходимое ML-окружение на инфраструктуре: Spark (PySpark), Airflow, Docker, GitLabCI, MLFlow, JupyterHub
владение практиками DevOps и понимание философии IaaC и self-service-platform.
возможность выбрать удобный формат работы: гибрид или офис
ежегодный пересмотр зарплаты, годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
ипотека выгоднее до 7% для каждого сотрудника
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.