H
HireSeeker

MLOps инженер — свежие вакансии

Обновляется каждый час. Найдено: 18 вакансий за последнюю неделю.

HireSeeker — агрегатор вакансий. Собираем вакансии со всех основных площадок и показываем по вашей специальности. Подпишитесь на ежедневную подборку только релевантных.

Посмотреть все вакансии →
Сайты компаний
лаборатория касперского

MLOps

лаборатория касперского2 дня назад↑ Вакансия с автоподнятием
Зарплата не указанаМоскваoffice

О команде

SS-infra (Security Services Infrastructure) — команда, занимающаяся развитием и построением инфраструктуры в составе Security Services. Мы строим, автоматизируем и защищаем инфраструктуру для «красных» и «синих» команд (Penetration Testing, Red Teaming, Incident Response, Threat Hunting и др.). Покрываем весь спектр DevOps/SecOps/DevSecOps.

Роль

Ищем инженера с ML- или DevOps-бэкграундом, который перешёл в MLOps. Нам нужен инженер, готовый пилотировать, внедрять и развивать новые решения и подходы. Помимо ML-инфраструктуры, нужно быть готовым помогать команде с классическими DevOps-задачами.

Обязанности

MLOps

  • Проектировать архитектуру AI-систем (от прототипа до production);
  • Внедрение GPU-планировщика (Kueue, Volcano или аналог) для шаринга нагрузки на одном железе
  • Проектирование и поддержка ML-пайплайнов (обучение, валидация, деплой моделей)
  • CI/CD для моделей: версионирование данных, моделей, экспериментов
  • Мониторинг production-моделей (drift detection, performance tracking)
  • Деплой и оптимизация LLM / inference-серверов (vLLM, TGI, Triton)

DevOps

  • Контейнеризация и оркестрация сервисов (Docker, K8s)
  • CI/CD (GitLab CI, Jenkins)
  • IaC (Terraform, Ansible)
  • Мониторинг и observability (Prometheus, Grafana, Loki)
  • Автоматизация рутинных операций
  • Обеспечение выполнения требований ИБ в отношении инфраструктуры
  • Ведение технической документации по вверенным ресурсам

Требования

  • Бэкграунд в ML/DS — понимание процессов обучения, инференса, работы с данными
  • Опыт от 2 лет в MLOps / DevOps с ML-спецификой (было бы огромным плюсом)
  • Docker, Kubernetes (Helm, управление кластерами) — production-опыт
  • Python — уверенное владение
  • CI/CD (GitLab CI, Jenkins, методология GitOps)
  • Глубокие знания Linux
  • Terraform / Ansible для IaC
  • Опыт построения или управления GPU-кластерами (NVIDIA, CUDA, nvidia-container-toolkit)
  • Опыт с GPU-планировщиками (Kueue, Volcano, Run:ai)
  • Опыт с MLflow, Kubeflow, Airflow или аналогами
  • Высшее техническое образование

Будет плюсом:

  • Опыт работы с LLM / inference-серверами (vLLM, TGI, Triton)
  • Знакомство со стеком команды: Gitlab, Nginx, Kafka, RabbitMQ, Elasticsearch, Loki, Grafana, Vault, Keycloak
  • Понимание специфики multi-tenant GPU-шаринга (MIG, MPS, time-slicing)
  • Опыт работы с Talos OS / Flatcar
  • Опыт построения гетерогенной инфраструктуры (on-premise + облака)
Эта вакансия также есть на:hh.ru
Сайты компаний
яндекс

MLOps Lead в Yandex Crowd

яндекс1 день назад↑ Вакансия с автоподнятием
Зарплата не указана

Yandex Crowd — крупный инфраструктурный сервис Яндекса. Мы используем краудсорсинг, чтобы расширять бизнес-процессы: разметку данных, модерацию контента, полевые исследования, тестирование. Также мы разрабатываем внутренние функции для наших продуктов: клиентский сервис, телемаркетинг, локализацию и документирование.

Наша цель — автоматизировать рутинные задачи краудсорс-исполнителей. Работаем по двум направлениям: асессорская разметка и клиентский сервис. Создаём и внедряем генеративных чат-ботов, агентов, co-pilot для операторов и асессоров, GenAI-based-разметку. Количество наших моделей и микросервисов, интегрированных в платформы, растёт. Нужно поддерживать стабильность, прозрачность и единообразие разработки и вывода в прод.

Ищем MLOps-лида, который соберёт команду и выстроит инфраструктуру и процессы для наших смелых ML-решений.

Автоматизация ML-процессов

Вам предстоит создавать эффективные автоматизированные пайплайны для обучения, тестирования и развёртывания ML-моделей, внедрять CI/CD и современные инструменты управления ML-процессами.

Стабильность и доступность моделей

Вам нужно будет обеспечивать стабильную работу моделей в продакшне, контролировать их состояние и гарантировать, что сервисы будут доступны для пользователей и отказоустойчивы.

Развитие ML-платформы

Вам предстоит определить техническое видение развития ML-платформы в Yandex Crowd и инструментов для Data Scientist, выстроить процессы, чтобы быстро и эффективно запускать новые решения, сократить время вывода их на рынок и масштабировать лучшие практики внутренней инфраструктуры.

Развитие команды MLOps-инженеров

Вы будете формировать и развивать команду MLOps-инженеров: нанимать сотрудников, быть для них наставником, передавать экспертный опыт, распределять задачи и способствовать их профессиональному росту.

* Работали в команде над разработкой на Python
* Руководили созданием и поддержкой бэкенд-сервисов
* Организовывали и внедряли системы мониторинга и логирования
* Умеете работать с Docker и Kubernetes
* Разбираетесь в полном жизненном цикле ML-моделей, выводе их в продакшн
* Способны принимать архитектурные решения

* Руководили построением или эволюцией CI/CD-процессов
* Внедряли инструменты для управления GenAI-решениями: RAG, агенты, LLM-пайплайны
* Занимались построением внутренних ML-платформ или сложных ML-продуктовых инструментов

Сайты компаний
сбер

MLOps инженер

сбер3 дня назад↑ Вакансия с автоподнятием
Зарплата не указанаг Москва

Мы — команда Data Science департамента «Занять и сберегать» (Управление искусственного интеллекта и исследования данных).

Ключевое направление, в котором вы будете работать:

  • Разработка и внедрение сложных ML-решений для автоматизации и интеллектуальной аналитики в сфере автоиндустрии. Ваши модели будут напрямую влиять на ключевые бизнес-процессы и приниматься миллионами пользователей.

  • разработка и поддержка ПРОМ дистрибутивов моделей

  • проведение моделей через стенды тестирования

  • автоматизировать процессы CI/CD для ML-проектов, работа с конвейером CI/CD

  • обеспечивать выполнение потоков по расписанию и в ручном режиме

  • взаимодействовать с DE/DS по формированию inference pipeline, с архитекторами и бэковыми системами по поводу размещения и настройки MEF-контейнеров и сопутствующих интеграций

  • работа со следующими средами исполнения: ПИМ (пакетное исполнение моделей) для оффлайн батчевого скоринга по расписанию и MEF (model execution framework) для онлайн-моделей в виде сервиса (скоринг по запросу).

  • опыт работы с MLOps-инструментами (Jenkins, Nexus, MLFLow, AirFlow).

  • понимание принципов CI/CD для ML

  • опыт работы с платформами интеграции моделей (ПИМ) и/или Model Exchange Framework (MEF) будет вашим преимуществом

  • навыки работы с контейнерами (Docker, Kubernetes)

  • уверенное владение Python, Bash, Git, PySpark, SQL

  • понимание принципов мониторинга и логирования ML-систем,

  • способность самостоятельно идентифицировать проблему и искать оптимальное ее решение.

  • комфортный современный офис рядом с м. Кутузовская

  • формат работы - фул-офис 5\2

  • ежегодный пересмотр зарплаты, годовая премия

  • корпоративный спортзал и зоны отдыха

  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития

  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа

  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ

  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров

  • вознаграждение за рекомендацию друзей в команду Сбера.

Сайты компаний
сбер

DevOps Engineer (AI / LLM / Kubernetes)

сбер1 день назад↑ Вакансия с автоподнятием
Зарплата не указанаг Москва

ы строим AI-платформу для юристов (GigaLegal): LLM-агенты, RAG, high-load inference и интеграции с внешними системами.

Ищем DevOps-инженера, который поможет собрать и масштабировать инфраструктуру под реальные прод-нагрузки в разных средах.

  • разворачивание и поддержка Kubernetes

  • работа с GPU-инфраструктурой (A100 / V100)

  • настройка CI/CD (GitOps, Helm, ArgoCD)

  • мониторинг и логирование (Prometheus, Grafana, Loki)

  • обеспечение отказоустойчивости и масштабирования.

  • оконченное высшее образование

  • опыт DevOps / SRE от 3 лет

  • опыт работы с Kubernetes

  • Docker, CI/CD, мониторинг

  • опыт работы и настройки SOWA

  • опыт разработки high-load систем

  • будет плюсом работа с ML / LLM / GPU.

  • формат работы офис на испытательном сроке, делее гибрид обсуждаем, локация офиса ул Вавилова д.19

  • ежегодный пересмотр зарплаты, годовая премия

  • корпоративный спортзал и зоны отдыха

  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития

  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа

  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ

  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров

  • вознаграждение за рекомендацию друзей в команду Сбера.

hh.ru
сбер. it
Зарплата не указанаМосква

Центр практического искусственного интеллекта занимается разработкой и внедрением высокотехнологичных AI-инструментов.

Задачи берутся из повседневной практики бизнеса.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика ждите сообщение от него в телеграмме, диалог займёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!

Вы будете:

  • разрабатывать, оптимизировать и поддерживать NLP/мультимодальные пайплайны, включая RAG-системы и ассистентов для бизнес-задач
  • создавать и развивать ИИ-агентов и мультиагентные системы (workflow-оркестрация, планирование, инструменты, memory-модули, интеграции с сервисами банка)
  • участвовать в формировании и проверке гипотез для улучшения качества моделей и пайплайнов
  • интегрировать агентские пайплайны в высоконагруженные сервисы банка, обеспечивая стабильность, производительность и мониторинг
  • адаптировать и внедрять результаты исследований в прикладные решения
  • разрабатывать сервисы вокруг моделей: API-слои, микросервисы, inference-скрипты, CI/CD для ML
  • обеспечивать качество кода и следить за инженерными практиками (тестирование, логирование, мониторинг)
  • участвовать в выборе и настройке инфраструктуры для инференса и обучения.

Требования:

  • уверенные технические навыки
  • глубокие знания NLP и уверенная база в классическом ML
  • опыт разработки RAG-систем, ML-ассистентов, работа с векторными хранилищами и retrieval-стеком
  • опыт разработки и продакшен-внедрения ML-сервисов
  • отличное знание Python, опыт написания промышленного, поддерживаемого и тестируемого кода, работы с параллелизмом и асинхронностью
  • опыт работы с мультиагентными фреймворками (LangGraph, LlamaIndex или другие)
  • уверенное владение инструментами разработки и инфраструктуры: bash, Docker/Openshift/Kubernetes, Git
  • опыт упаковки моделей в сервисы и интерфейсы (FastAPI, Flask, Tornado; будет плюсом UI-фреймворки типа StreamLit/ChainLit)
  • понимание технологий инференса и обучения больших моделей (vLLM, DeepSpeed, Accelerate)
  • опыт интеграции генеративных моделей в реальные бизнес-процессы
  • знание CI/CD для ML/infra (GitLab CI/GitHub Actions/ArgoCD)
  • навыки профилирования, оптимизации и мониторинга систем в проде (Prometheus/Grafana/OpenTelemetry)
  • понимание MLOps-паттернов: feature store, model registry, rollout/rollback стратегий.

Будет плюсом:

  • опыт работы с мультимодальными моделями (Vision/Audio LLMs)
  • опыт распределённого обучения и оптимизации больших моделей.

Мы предлагаем:

  • комфортный современный офис г. Москва, рядом с метро Кутузовская
  • офисный формат работы (возможно обсудить гибрид после исп.срока)
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
Сайты компаний
сбер
Зарплата не указанаг Москва

Центр практического искусственного интеллекта занимается разработкой и внедрением высокотехнологичных AI-инструментов.

Задачи берутся из повседневной практики бизнеса.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика ждите сообщение от него в телеграмме, диалог займёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!

Вы будете:

  • разрабатывать, оптимизировать и поддерживать NLP/мультимодальные пайплайны, включая RAG-системы и ассистентов для бизнес-задач
  • создавать и развивать ИИ-агентов и мультиагентные системы (workflow-оркестрация, планирование, инструменты, memory-модули, интеграции с сервисами банка)
  • участвовать в формировании и проверке гипотез для улучшения качества моделей и пайплайнов
  • интегрировать агентские пайплайны в высоконагруженные сервисы банка, обеспечивая стабильность, производительность и мониторинг
  • адаптировать и внедрять результаты исследований в прикладные решения
  • разрабатывать сервисы вокруг моделей: API-слои, микросервисы, inference-скрипты, CI/CD для ML
  • обеспечивать качество кода и следить за инженерными практиками (тестирование, логирование, мониторинг)
  • участвовать в выборе и настройке инфраструктуры для инференса и обучения.

Требования:

  • уверенные технические навыки
  • глубокие знания NLP и уверенная база в классическом ML
  • опыт разработки RAG-систем, ML-ассистентов, работа с векторными хранилищами и retrieval-стеком
  • опыт разработки и продакшен-внедрения ML-сервисов
  • отличное знание Python, опыт написания промышленного, поддерживаемого и тестируемого кода, работы с параллелизмом и асинхронностью
  • опыт работы с мультиагентными фреймворками (LangGraph, LlamaIndex или другие)
  • уверенное владение инструментами разработки и инфраструктуры: bash, Docker/Openshift/Kubernetes, Git
  • опыт упаковки моделей в сервисы и интерфейсы (FastAPI, Flask, Tornado; будет плюсом UI-фреймворки типа StreamLit/ChainLit)
  • понимание технологий инференса и обучения больших моделей (vLLM, DeepSpeed, Accelerate)
  • опыт интеграции генеративных моделей в реальные бизнес-процессы
  • знание CI/CD для ML/infra (GitLab CI/GitHub Actions/ArgoCD)
  • навыки профилирования, оптимизации и мониторинга систем в проде (Prometheus/Grafana/OpenTelemetry)
  • понимание MLOps-паттернов: feature store, model registry, rollout/rollback стратегий.

Будет плюсом:

  • опыт работы с мультимодальными моделями (Vision/Audio LLMs)
  • опыт распределённого обучения и оптимизации больших моделей.

Мы предлагаем:

  • комфортный современный офис г. Москва, рядом с метро Кутузовская
  • офисный формат работы (возможно обсудить гибрид после исп.срока)
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
hh.ru
сэнсэй

DevOps/MLOps инженер

сэнсэй6 дней назад
до 300k ₽Москваoffice

Аккредитованная ИТ-компания реализует динамично развивающийся проект в сфере здравоохранения. Легаси-кода и готовой инфраструктуры нет — всё предстоит построить. Нам нужен эксперт, который силён в Kubernetes и понимает жизненный цикл ML-моделей (опыт MLOps будет большим преимущество).

Чем предстоит заниматься

Инфраструктура

  • Проектирование и развёртывание продакшн-кластера Kubernetes (On‑premise) с нуля;
  • Выбор и настройка сетевых политик, Ingress-контроллеров, систем хранения;
  • Внедрение автомасштабирования, управление ресурсами и QoS;
  • Построение мониторинга и алертинга на уровне кластера и приложений.

MLOps

  • Проектирование пайплайнов для обучения и инференса моделей внутри K8s;
  • Внедрение трекинга экспериментов и версионирования данных;
  • Оркестрация пайплайнов;
  • Настройка высокопроизводительного инференса с поддержкой GPU.

Ключевые требования

Обязательные

  • Коммерческий опыт работы с Kubernetes в продакшене от 2+ лет — глубокое понимание внутреннего устройства: CRD, Operators, контроллеры, работа с etcd и kube-apiserver;
  • Уверенное знание Linux и сетей (TCP/IP, DNS, балансировка);
  • Языки программирования: Python и/или Go;
  • Опыт настройки мониторинга и логирования.

Желательные

  • Понимание жизненного цикла ML-моделей;
  • Опыт работы с GPU-оператором в K8s (NVIDIA GPU Operator) и управление GPU-нодами;
  • Знакомство с инструментами оркестрации (Airflow, Argo Workflows, Kubeflow) — даже на уровне pet-проектов.

Условия работы

  • Удалённый формат;
  • Фиксированный проект, но с возможностью дальнейшего продолжения сотрудничества.

hh.ru
Зарплата не указанаМоскваoffice

Команда AI-Hub Блока Финансы разрабатывает и поддерживает централизованную среду разработки, хранения и исполнения AI-агентов и ML-моделей. В нашу зону ответственности входит эксплуатация ИТ-инфраструктуры, разработка сервисов интеграций, поддержка инструментов разработки AI-агентов. Благодаря нашей работе команды Блока Финансы имеют централизованные сервисы работы с GigatChat и API по работе с AI-агентами при выполнении современных требований архитектуры и кибербезопасности. Мы ищем опытных разработчиков для создания платформенных инструментов и инструментов интеграции, которых помогут нашим командам легко разрабатывать, внедрять и сопровождать AI-агентов.

Обязанности

  • Разработка и внедрение CI/CD-пайплайнов для автоматизации нагрузочного тестирования
  • Разработка и поддержка Helm-чартов для развёртывания AI-агентов и ML-сервисов в Kubernetes.
  • Организация и поддержка тестовых стендов (авто развертывание инфраструктуры)
  • Разработка сценариев нагрузочного тестирования для API AI-агентов
  • Автоматизация других видов тестирования:
  • Функциональное тестирование AI-логики (валидация ответов, оценка качества генерации).
  • Интеграционное тестирование с внешними системами (БД, Kafka, OpenSearch, Redis).
  • Тестирование безопасности (проверка токенов, RBAC, защита от инъекций).
  • Тестирование моделей (drift detection, проверка входных/выходных схем).
  • Развитие системы самообслуживания:
  • Создание удобных интерфейсов (CLI, Web UI на Streamlit) для запуска тестов и деплоя.
  • Упрощение вывода AI-агентов в ПРОМ с автоматической проверкой качества.
  • Написание скриптов и сервисов автоматизации:
  • На Python (FastAPI, asyncio) — для создания вспомогательных сервисов тестирования.
  • На Groovy — для расширения Jenkins-пайплайнов.
  • Автоматизация рутинных операций

Требования

  • Глубокое знание CI/CD и практик построения пайплайнов (Jenkins, ArgoCD, GitOps).
  • Опыт автоматизации нагрузочного и интеграционного тестирования в микросервисной среде.
  • Отличное знание Helm, Kubernetes-манифестов, принципов развёртывания высоконадёжных сервисов:
  • Балансировка нагрузки, RateLimiting, Service Mesh (Istio), readiness/liveness пробы.
  • Уверенное владение Docker и принципами контейнеризации.
  • Опыт работы с БД: PostgreSQL, OpenSearch, Redis, ClickHouse, векторные БД.
  • Знание SQL и NoSQL, умение проектировать и оптимизировать запросы.
  • Опыт разработки сервисов на Python (FastAPI, pytest, requests, asyncio).
  • Навыки написания автоматизированных тестов через LLM

Будет плюсом

  • Опыт с инструментами нагрузочного тестирования Банка
  • Работа с методиками оценки качества генерации ИИ
  • Понимание принципов MLOps
  • Опыт с мониторингом и алертингом (Prometheus, Grafana)

Условия

  • ​формат работы- офис/гибрид, Вавилова 19
  • ежегодный пересмотр зарплаты, годовой бонус
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера
  • корпоративная пенсионная программа.
hh.ru
в кадре

ML-инженер

в кадре5 дней назад
250k–300k ₽Москваoffice

О компании:

ИТ-ИМПЛАНТ - аккредитованный системный интегратор, специализирующийся на заказной разработке и внедрении индивидуальных ИТ-решений для бизнеса.

Миссия компании:

Для компаний: Дать возможность сильным компаниям увеличиваться, благодаря аутстаффингу эффективных IT-специалистов.

Для соискателей: Дать возможность трудоустройства сильным соискателям в передовые компании на выгодных условиях труда.

Мы ищем ML-инженеров на наши проекты!


Обязанности:

  • Полный цикл разработки ML-моделей: от исследований и прототипирования до промышленного внедрения, мониторинга и поддержки (MLOps).

  • Участие в создании и оптимизации пайплайнов данных (data pipelines) для обучения и инференса моделей.

  • Разработка, тренировка, валидация и оптимизация ML-моделей для решения задач: [укажите направление, например: прогнозирование, классификация, рекомендательные системы, NLP, Computer Vision].

  • Интеграция ML-моделей в production-окружение (микросервисы, API, стриминг).

  • Работа с облачной инфраструктурой (Yandex Cloud / AWS / GCP / Azure) для развертывания и масштабирования ML-сервисов.

  • Автоматизация процессов обучения, тестирования и деплоя моделей (CI/CD для ML).

  • Создание и поддержка инструментов мониторинга качества моделей и данных (data/concept drift).

  • Тесное взаимодействие с Data Scientists, аналитиками и продуктовыми командами.

Требования:

  • Опыт коммерческой разработки на позиции ML Engineer / Data Scientist от 3-х лет.

  • Уверенное владение Python и основными библиотеками для ML/DL: Scikit-learn, Pandas, NumPy, PyTorch / TensorFlow.

  • Понимание основных алгоритмов машинного обучения, их применимости и ограничений.

  • Опыт работы с инструментами контейнеризации и оркестрации: Docker, Kubernetes.

  • Умение писать эффективный, поддерживаемый и документированный код (знание Git обязательно).

  • Опыт построения и оптимизации ETL/ELT-пайплайнов.

  • Навыки работы с базами данных (SQL, понимание NoSQL).

  • Способность самостоятельно доводить задачи от идеи до работающего production-решения.

Будет сильным преимуществом:

  • Опыт работы с одним из облачных провайдеров (Yandex Cloud, AWS Sagemaker, GCP Vertex AI, Azure ML).

  • Практический опыт в одном из направлений: LLM (Large Language Models), NLP, Computer Vision, Recommendation Systems, Time Series Forecasting.

  • Знание фреймворков для MLOps: MLflow, Kubeflow, Airflow, Feast.

  • Опыт работы со стриминговыми данными (Apache Kafka, Spark Streaming).

  • Понимание принципов разработки высоконагруженных и отказоустойчивых систем.

  • Знание дополнительных языков (Go, Java, C++).

Мы предлагаем:

  • Удалённый формат работы
  • Оформление по Самозанятости или ИП (По ТК РФ ставка будет ниже)
  • Фултайм
  • График работы с гибким началом рабочего дня

    Стеки на проектах разные, отликайтесь!
Сайты компаний
Зарплата не указанаМосква

Мы - команда платформы обучения моделей, отвечаем за автоматизацию процессов подготовки данных, проведения экспериментов, базовые инструменты, инфраструктуру и автоматику, которая снимает головную боль с наших инженеров и помогает им двигаться быстрее.

  • управлением командой (найм, 1-1, мотивация и тп)

  • постановка задач, операционное ревью и квартальных целей

  • разворачиванием, предоставлением, поддержкой и развитием инфраструктуры ML-платформы

  • интеграцией инструментов и с инфраструктурой и окружениями проведения экспериментов и подготовки данных

  • мониторингом и обеспечением бесперебойной работы ML-платформы

  • мониторингом и оценкой утилизации аппаратных ресурсов и машинерией для реализации fair-share механизмов.

  • опыт управления командой от 5 человек от 3 лет (найм, целеполагание, управление конфликтами, планирование, операционка)

  • опыт использования и работы с: Linux, bash, Python3, pytest, SQL, Kubernetes, Grafana, VictoriaMetrics, OTLP, ELK, Moira и тп

  • опыт использования LLM стека инструментов: vLLM, SGLang, FSDP, Ray, TRL, NeMO, W&B, SLURM, RLI, Verl, Lustre и тп;

  • умение разворачивать, настраивать, мониторить необходимое ML-окружение на инфраструктуре: Spark (PySpark), Airflow, Docker, GitLabCI, MLFlow, JupyterHub

  • владение практиками DevOps и понимание философии IaaC и self-service-platform.

  • возможность выбрать удобный формат работы: гибрид или офис

  • ежегодный пересмотр зарплаты, годовая премия

  • корпоративный спортзал и зоны отдыха

  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития

  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа

  • ипотека выгоднее до 7% для каждого сотрудника

  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров

  • вознаграждение за рекомендацию друзей в команду Сбера.

Эта вакансия также есть на:hh.ru
hh.ru
lamoda tech

Senior MLOps

lamoda tech4 дня назад
Зарплата не указанаМоскваoffice

Мы в поисках MLOps-иженера в команду обеспечению надежности машинного обучения. Ты будешь участвовать в проектировании и развитии платформы для полного жизненного цикла машинного обучения: от экспериментов и обучения моделей до промышленного сервинга, мониторинга, переобучения и вывода моделей из эксплуатации. Мы ищем специалиста с опытом и отраслевой экспертизой, готового принимать архитектурные и инженерные решения, автоматизировать процессы и повышать надежность ML-платформы.

Чем предстоит заниматься:

  • Разрабатывать и поддерживать инфраструктуру для экспериментов, обучения и деплоя ML-моделей в batch и online режимах на CPU/GPU
  • Автоматизировать жизненный цикл модели от регистрации до промышленного сервинга: сборка образов, проверки, публикация артефактов, деплой, канареечные релизы, A/B-тесты и откаты
  • Проектировать и развивать платформу инференса для batch- и online-сценариев на CPU/GPU
  • Развивать ML-инфраструктуру на базе Kubernetes: кластеры, GPU-ресурсы, операторы, изоляция окружений, автоскейлинг, маршрутизация трафика и управление ресурсами
  • Развивать и поддерживать платформенные компоненты для работы с признаками, моделями и ML-артефактами
  • Развивать мониторинг ML-систем: инфраструктурные метрики, метрики сервинга, качество моделей, распределения входных данных, дрейф данных и деградация поведения моделей
  • Обеспечивать воспроизводимость и управляемость ML-процессов: версионирование кода, данных и моделей, история экспериментов, изоляция сред обучения и инференса, аудит изменений
  • Оптимизировать использование вычислительных ресурсов, включая GPU, с учетом надежности, производительности и стоимости
  • Исследовать новые инструменты и подходы в MLOps, оценивать их применимость и внедрять там, где это повышает надежность, скорость разработки или эффективность платформы

Мы ожидаем:

  • Опыт внедрения и сопровождения Kubernetes-кластеров для сервинга ML-моделей на GPU и CPU

  • Практический опыт эксплуатации инструментов для деплоя и обслуживания моделей: Triton Inference Server, BentoML или аналогичных решений

  • Опыт запуска и поддержки инференс-движков в Kubernetes

  • Понимание подходов к автоскейлингу, балансировке нагрузки и маршрутизации запросов для ML-сервисов

  • Понимание принципов мониторинга качества, поведения и эксплуатационных параметров ML-моделей

  • Опыт настройки GPU-инфраструктуры: драйверы, CUDA Toolkit, MIG, GPU-enabled Docker, nvidia-container-toolkit

  • Понимание жизненного цикла ML-экспериментов и инструментов их трекинга: MLflow, ClearML или аналогов

  • Уверенное владение Python для автоматизации, разработки внутренних инструментов и интеграций

  • Уверенный опыт работы с Kubernetes в production: workloads, операторы, Helm, HPA, ingress, storage, observability, диагностика и устранение проблем

  • Опыт описания и автоматизации инфраструктуры на базе IaC: Terraform, Ansible, GitOps-подходы

  • Опыт работы с системами контроля версий и организации CI/CD (GitLab, Bitbucket, Bamboo)

  • Опыт работы с Docker и OCI-образами: сборка, оптимизация, публикация и эксплуатация

  • Уверенное владение Linux: настройка, мониторинг, диагностика сетевых, файловых, ресурсных и производительных проблем

  • Опыт настройки мониторинга и алертинга: Prometheus Stack

  • Опыт безопасной работы с секретами, токенами, сертификатами и чувствительными данными

Будет плюсом

  • Опыт работы с Yandex Cloud, bare metal-инфраструктурой или гибридными окружениями

  • Опыт работы с Kubeflow Pipelines, Kubeflow Notebooks, Kubeflow Katib, Kubeflow KServe

  • Опыт работы с Feature Store: Feast, Aerospike, key-value-хранилища или аналогичные решения

  • Опыт работы с DVC, Git LFS, реестрами моделей и хранилищами ML-артефактов

  • Опыт работы со Spark, Trino, Hadoop, JupyterHub

hh.ru
ртк-цод

Главный инженер

ртк-цод4 дня назад
Зарплата не указанаМоскваoffice
Обязанности:
  • Развивать и поддерживать платформу для запуска ML workloads.
  • Администрировать и диагностировать проблемы в Kubernetes-кластера ML платформы.
  • Автоматизировать рутинные задачи с помощью инструментов автоматизации - python, ansible и terraform.
  • Поддерживать и развивать CI/CD-пайплайны и Helm чарты для ML сервисов.
  • Выполнять клиентские заявки высокой сложности в Service Desk, ESMP, Jira.
  • Настраивать мониторинг ML инфраструктуры - Prometheus, Grafana, Loki, Zabbix.
  • Участвовать в проработке архитекруры будущих ML сервисов со стороны эксплуатации.
  • Проводить плановые работы любого уровня сложности.
  • Вести документацию в рамках зоны ответственности отдела.
  • Вести аварии и составлять планы пост аварийных мер на ML платформе.
Требования:
  • Опыт администрирования Kubernetes кластеров от одного года.
  • Понимание, как работают основные компоненты Kubernetes: kube-apiserver, scheduler, controller-manager, kubelet, kube-proxy, etcd, CoreDNS.
  • Практический опыт диагностики проблем в Kubernetes: networking, scheduling, probes, ресурсы, storage, ingress, RBAC, CRD/operators.
  • Опыт работы с Helm: написание, модификация, шаблонизация, отладка и проверка чартов.
  • Опыт работы с системами автоматизации: Ansible и Terraform
  • Уверенное знание Linux на уровне администратора
  • Понимание сетей в Linux и Kubernetes: routing, iptables/nftables, IPVS, DNS, service discovery, network policies, K8S CNI Calico/Cilium
  • Опыт работы с CI/CD: желателен GitLab CI.
  • Понимание Gitops подхода и цикла разработки приложение для k8s.
  • Знание одного из языков программирования на среднем уровне: Python или Go.
  • Опыт работы с системами мониторинга и логирования: Prometheus, Grafan, Loki, Zabbix или аналоги.
  • Умение самостоятельно расследовать сложные технические проблемы, читать логи, метрики, события Kubernetes и исходники/документацию при необходимости.

Будет плюсом

  • Опыт эксплуатации GPU-инфраструктуры в Kubernetes.
  • Опыт работы с NVIDIA stack: GPU Operator, Network Operator, MIG, vGPU, NCCL
  • Опыт с ML serving/inference технологиями: NVIDIA Triton, vLLM, Transformers, SGLang, TensorRT-LLM.
  • Опыт работы с KServe, Knative, Kubeflow.
  • Опыт с service mesh/gateway-слоем в k8s: Istio, Envoy Gateway, Gateway API.
  • Опыт с storage в Kubernetes: Ceph/Rook
  • Опыт работы с baremetal серверами и облаками.
  • Понимание особенностей high-load inference workloads: long-running requests, streaming, autoscaling, GPU scheduling, лимиты ресурсов, latency, throughput.
Условия:
  • Стабильный и прозрачный «белый» доход и полноценный соц. пакет;
  • График работы 5/2, гибкое начало дня, гибридный или удаленный формат работы + три дополнительных дня отпуска в год;
  • Корпоративный университет, который организует внутреннее и внешнее профильное обучение;
  • Перспективы горизонтального и вертикального карьерного роста: вы можете стать руководителем или экспертом в своей области;
  • Программу ДМС с обслуживанием в лучших клиниках города+оплата мобильной связи;
  • Возможность принять участие в амбициозных, крупных и стабильных проектах.
hh.ru
250k–300k ₽Москваoffice

AdminDivision admindivision.ru / ООО “ВПРОД” vprod.ru

Вакансия MLOps-инженер / инженер внедрения (LLM Platform / Inference)

Уровень: Middle+/Senior

Формат: Полностью удалённая работа, full-time или part-time занятость, оформление по ТК

Зарплата: По итогам собеседования (конкурентная рыночная вилка)

AdminDivision — команда инженеров с большим опытом построения высоконагруженных и отказоустойчивых систем для телекома, финтеха и IT-компаний.

Сейчас мы активно развиваем направление MLOps и LLM Platform и ищем сильного инженера, который будет внедрять и сопровождать ML/LLM-решения на production-инфраструктуре заказчиков.


Что предстоит делать:

  • Внедрять и адаптировать LLM-решения на инфраструктуре клиентов

  • Разворачивать и сопровождать inference-сервисы в Kubernetes (vLLM, KServe, LiteLLM и др.)

  • Настраивать GPU workloads, storage, networking и observability

  • Проводить анализ, диагностику и устранение инцидентов

  • Консультировать ML/ML-инженеров и команды разработки по инфраструктуре

  • Готовить качественную документацию и runbook’и

  • Вести проекты в составе команды и быть ответственным за результаты своей части работы

Что для нас важно:

Linux и эксплуатация

  • Уверенная работа с Linux в production: troubleshooting CPU, memory, disk, network, logs

  • Понимание сетей (TCP/IP, DNS, HTTP/HTTPS), опыт с nginx / Traefik / аналогами

Kubernetes

  • Практический опыт эксплуатации Kubernetes в production

  • Уверенное владение Deployment, StatefulSet, Service, Ingress, PVC, Helm

  • Умение быстро разбирать CrashLoopBackOff, OOMKilled, проблемы scheduling и readiness/liveness

DevOps и автоматизация

  • Опыт написания и отладки Ansible-ролей

  • Docker (написание и оптимизация Dockerfile)

  • CI/CD (GitLab CI или GitHub Actions): сборка, тестирование и деплой контейнеров

Мониторинг

  • Prometheus / VictoriaMetrics + Grafana

  • Умение писать PromQL и строить дашборды

MLOps / LLM

  • Понимание inference-пайплайна и компонентов: vLLM, KServe, LiteLLM, embedding/reranking, model routing

  • Базовое понимание GPU serving: VRAM sizing, batching, KV cache, tensor parallelism


Будет большим плюсом:

  • Опыт с GPU Operator / NVIDIA device plugin

  • Argo CD / GitOps

  • Self-hosted LLM-платформы

  • PostgreSQL + Patroni, object storage (S3)

  • MLflow, Airflow, vector DB, RAG


Мы предлагаем:

  • Реальные production-задачи на стыке Kubernetes, GPU и LLM

  • Возможность влиять на архитектуру и процессы

  • Сильную инженерную команду и сложные технические вызовы

  • Полностью удаленный формат работы с оформлением по ТК в компании с гос.аккредитацией

hh.ru
юнистрим банк

ML-инженер

юнистрим банк3 дня назад
Зарплата не указанаМоскваoffice

Мы планируем построить и внедрить локальные LLM-решения для автоматизации внутренних бизнес-процессов. Наша цель — обеспечить высокий уровень безопасности данных, контролируемость инфраструктуры и независимость от внешних облачных провайдеров, где это критично. Мы ищем инженера, который сможет спроектировать архитектуру, настроить пайплайны и вывести модели в промышленную эксплуатацию в корпоративном контуре.

Обязанности:

  • Архитектура и разработка: Проектирование и разработка корпоративной LLM-платформы с фокусом на локальное развертывание (on-premise) и использование open-source моделей;

  • Интеграция фреймворков: Построение пайплайнов обработки данных и оркестрации запросов с использованием Open WebUI, LiteLLM, Langflow и RAGFlow для создания RAG-приложений и агентных рабочих процессов;

  • Инфраструктура и инференс: Настройка высокопроизводительного инференса моделей с использованием vLLM для обеспечения низкой задержки и эффективного использования GPU-ресурсов;

  • Унификация доступа: Настройка единого шлюза для управления подключениями к различным LLM (как локальным, так и внешним через OpenRouter) для гибкости и резервирования;

  • Интеграция и автоматизация: Встраивание ML-решений во внутренние системы компании (CRM, HRM, документооборот) и автоматизация рутинных задач сотрудников;

  • MLOps/LLMOps: Внедрение практик мониторинга, версионирования промптов и моделей, а также CI/CD для ML-компонентов.

Требования:
  • От 2-х лет коммерческого опыта в разработке и внедрении ML/AI решений;

  • Стек технологий (Core):

  1. Глубокое знание и опыт работы с указанным стеком: Open WebUI (как интерфейс для взаимодействия с моделями);

  2. LiteLLM (прокси-сервер для унификации API), Langflow или LangChain (оркестрация цепочек), RAGFlow (реализация RAG-пайплайнов);

  3. Опыт оптимизации инференса моделей с использованием vLLM или аналогичных библиотек (TensorRT, ONNX);

  4. Знание OpenRouter как агрегатора API-провайдеров.

  • Разработка: Продвинутый уровень Python (асинхронное программирование, FastAPI);

  • Базы данных: Опыт работы с векторными базами данных (Pinecone, Milvus, Qdrant, FAISS);

  • Инфраструктура: Опыт контейнеризации и оркестрации (Docker и тп), понимание принципов работы GPU в кластере.

Будет плюсом:

  • Опыт работы с локальными open-source моделями (Llama, Qwen, Deepseek);
  • Опыт интеграции AI в корпоративные системы (1С, SAP, Jira, Confluence, Битрикс24 и тп);
  • Знание MLOps практик (MLflow, Weights & Biases);
  • Опыт построения систем с учетом требований информационной безопасности и соблюдения локального законодательства (152-ФЗ) — использование локальной инфраструктуры для обработки персональных данных.

Личные качества (Soft Skills):

  • Системное мышление и способность видеть продукт целиком, а не только ML-модель;
  • Коммуникабельность: умение объяснять технические решения бизнес-заказчикам и стейкхолдерам;
  • Проактивность: готовность предлагать архитектурные решения и брать ответственность за их реализацию;
  • Стремление к изучению нового: быстро меняющийся стек LLM требует постоянного самообучения.
Условия:
  • Интересные задачи и проекты;
  • Оформление по ТК РФ;
  • Официальная заработная плата (уровень оплаты труда, обсуждается с успешным кандидатом на собеседовании);
  • График работы 5/2 пн-чт с 09.30 до 18.15, пятница с 09.30 до 17.00;
  • Возможность гибридного или удаленного формата работы.
hh.ru
вим инвестиции

MLOps engineer (invest tech)

вим инвестиции3 дня назад
Зарплата не указанаМоскваoffice

АО «ВИМ Инвестиции» — признанный лидер на российском рынке управления инвестиционными фондами. Мы создаем передовые финансовые продукты, помогая крупным частным клиентам и корпорациям эффективно управлять капиталом и уверенно смотреть в будущее. Управляем крупнейшим биржевым фондом в России — БПИФ «ВИМ - Ликвидность» (LQDT).

Мы активно развиваем Invest Tech в организации и ищем инженера в направление разработки AI/ML-сервисов для поддержки инвестиционных решений и повышения доходности инвестиционных продуктов (биржевые фонды и стратегии доверительного управления), который возьмет лидерство в построении локальной и облачной инфраструктуры вычислений и данных – MLOps и Data Engineering.

  • Green field (0→1): предстоит выстроить ML- и GenAIOps-платформу «с нуля», настроить и внедрить исполнение / инференс LLM и классических ML-моделей, автомасштабирование, векторную базу данных и централизованное RAG-приложение, функциональный мониторинг (трассировка действий агентской системы, метрики качества системы, моделей, данных и т.д.), инструменты развертывания в prod-среде, версионирования и онлайн экспериментирования.
  • Видеть результат: прямое влияние на доходность продуктов и эффективность бизнес-процессов в организации, а не только на низкоуровневые метрики.
  • Kaggle-like: уникальный проект на рынке, интересные прикладные задачи, внедряем cutting-edge технологии, вовлекаем соревновательный элемент.

Обязанности:

  • Проектирование инженерных сервисов уровня ML и GenAIOps-платформы для снятия рутинных операций с ML-инженеров и абстрагирования сложных настроек и пайплайнов, формирование долгосрочной стратегии платформы (hardware, middleware, интеграции, пайплайны, стандарты, SLO/SLA).
  • Техническая реализация платформенного решения и инженерных сервисов (разработка и развертывание компонент, программирование интеграционных интерфейсов, автоматизация пайплайнов CI / CD для ИИ-приложений, непрерывного до-обучения / fine-tune и мониторинга в prod-среде).
  • Непосредственно осуществлять развертывание, интеграцию и настройку специализированных компонентов NVIDIA Triton + бэкэнды, N8n, Langfuse, LiteLLM, Prometheus adapter / KEDA, MinIO, Milvus / Qdrant, Istio, Flagger и пр.
  • Поддержание необходимого окружения в средах dev / test / uat / prod / dr.
  • Предоставление ИИ-сервисов (serving) и выполнение SLA уровня платформы. Разработка стратегии использования LLM, развертывание LLM во внутреннем контуре организации, оптимизация инференса по утилизации GPU, задержке выдач и пропускной способности (форматы LLM, конфигурации, методы).
  • Создание централизованных хранилищ признаков (online, offline feature store). Построение и поддержание пайплайнов данных и витрин ИИ-приложений.
  • Централизованное управление учетными данными и правами доступа к сервисам платформы, ИИ-приложениям и витринам данных.
  • Повышение производительности сервисов end-to-end: профилирование узких мест по данным, интеграциям, инференсу и приложениям. Совершенствование надёжности и безопасности: реализовывать кэширование, масштабирование, реплицирование, мониторинг, алерты, сегментирование данных и DR.
Требования:
  • Не менее 5-и лет опыта в роли ML / GenAI / DevOps-инженера.
  • Не менее 3-х лет опыта работы с LLM / ML в prod-среде (обязательно).
  • Продвинутый уровень владения Python и SQL, знание C++.
  • Практика конфигурирования и оптимизации инференса LLM.
  • Знание контейнеризации и уверенное владение Docker и Kubernetes (развертывание, масштабирование, YAML-манифесты, Helm-чарты).
  • Знание Git, MinIO (S3), ClickHouse, PostgreSQL, Airflow, MLflow, Kong.
Условия:
  • Комфортный офис в Москва Сити (гибридный формат работы);

  • ДМС с первого дня работы, включающая стоматологию, страхование жизни и возможность подключения родственников;

  • Сервис корпоративных скидок Best Benefit;

  • Конкурентный уровень заработной платы.

hh.ru
до 200k ₽Москваoffice

Мы – одни из лидеров в нашем направлении!

Более 20 лет мы осуществляем доставку питьевой, минеральной и лечебной воды, а также сопутствующих товаров на дом и в офис.

Мы верим в возможности каждого кандидата и помогаем раскрыть их полностью!

РАБОТА В ОФИСЕ на испытательном сроке!!!


Обязанности:

  • Выявление задач, которые могут быть автоматизированы с помощью искусственного интеллекта (ИИ), подготовка предложений по внедрению ИИ.
  • Мониторинг существующих продуктов и решений в области ИИ и анализ опыта их внедрения и эксплуатации.
  • Поиск оптимального продукта /решения в области ИИ для бизнеса (торговля).
  • Внедрение ИИ в процессы компании.
  • Участие в формировании технического задания и других документов с требованиями к решениям в области ИИ.
  • Взаимодействие с подрядчиками, разработчиками и сотрудниками подразделений компании по вопросам внедрения и эксплуатации решений в области ИИ.
  • Консультирование разработчиков, тестировщиков по поставленной задаче.
  • Участие в тестировании и настройке продуктов/решений в области ИИ.

Требования:

  • Понимание принципов работы и процессов коммерческой деятельности, включая продажи, логистику, оценку рыночного спроса, ценообразование и т. д.
  • Высокий уровень аналитических навыков, умение анализировать сложные данные и представлять результаты в понятной форме, навыки формирования презентационных материалов.
  • Понимание возможностей различных типов ИИ.
  • Опыт внедрения ИИ в бизнес-процессы предприятия.

Условия:

  • Заработная плата обсуждается по результатам собеседования с успешным кандидатом.
  • График работы: 5/2 с 09-00 до 18-00.
  • Трудоустройство в соответствии с ТК РФ
Соц.сети
lamoda

Senior MLOps Engineer

lamoda6 часов назад
Зарплата не указанаМоскваoffice

Senior MLOps Engineer Lamoda

Местоположение: Москва
Формат работы: Офис
Опубликована: 29.06.2026

Требования:
• Опыт работы с Kubernetes для сервинга ML‑моделей
• Знание Triton Inference Server или BentoML
• Автоматизация CI/CD пайплайнов (GitLab, Helm, Terraform)
• Владение Python для автоматизации

О компании
Lamoda — крупный онлайн‑ритейлер моды в России, развивает AI‑продукты и предлагает широкий набор соц‑бенефитов.

Вакансия опубликована в LinkedIn у Ilya Martynishin

hh.ru
абк
Зарплата не указанаМоскваoffice

Кто мы?

«АктивБизнесКонсалт» –– технологичная финансовая компания. Основаны Сбером в 2013 году, работаем в направлении урегулирования задолженности. Мы сопровождаем процесс урегулирования на всех этапах, а так же создаем ИТ-инфраструктуру для более удобной работы в этом направлении.

Сейчас «АБК» это
- 3 офиса (Москва, Орел и Волгоград)
- 500+ сотрудников
- 13+ лет экспертизы
- четкое соблюдение законодательства, мы честны со своими сотрудниками и клиентами

О проекте

Мы строим современную платформу данных для финансовой компании.
Мигрируем инфраструктуру с legacy на Kubernetes стек: Apache Iceberg, Spark, Trino, Airflow. Обрабатываем сотни миллионов финансовых записей

Миссия команды: обеспечение надежной и масштабируемой инфраструктуры для платформы данных, автоматизация процессов развертывания, мониторинга и эксплуатации data-сервисов

Стек платформы

Kubernetes (production-кластеры),Apache Spark, Apache Airflow, Trino, Apache Iceberg, OpenMetadata,S3 (MinIO), Iceberg tables, PostgreSQL,GitLab CI/CD,Terraform, Ansible, Helm,Prometheus, Grafana, Docker

Что предстоит делать?

  • Развертывание и поддержка кластеров Kubernetes для Airflow, Spark, Trino, OpenMetadata и вспомогательных сервисов
  • Написание и поддержка Helm-чартов для всех компонентов Дата Платформы
  • Разработка и поддержка CI/CD пайплайнов (GitLab CI) для развертывания DAG, конфигов, Helm-чартов и Docker-образов
  • Настройка мониторинга инфраструктуры и data-приложений (Prometheus, Grafana)
  • Настройка алертинга и логирования для Spark-джобов, Airflow DAGs и Trino-запросов
  • Управление S3/MinIO-хранилищем для datalake (Iceberg tables)
  • Оптимизация ресурсов K8s для Spark-джобов
  • Обеспечение безопасности и управление доступом к инфраструктуре
  • Автоматизация инфраструктуры через Terraform
  • Разработка документации, актуализация базы знаний, написание инструкций
  • Взаимодействие с дата-инженерами и аналитиками по вопросам инфраструктуры

Мы ищем сотрудника,у которого есть:

  • Опыт работы DevOps-инженером от 1-3 лет
  • Глубокие знания Kubernetes
  • Helm: написание чартов с нуля, кастомизация, управление зависимостями
  • Опыт построения CI/CD пайплайнов с полным циклом доставки Dev и Prod
  • Опыт администрирования Linux-систем, Bash
  • Docker: сборка образов, оптимизация
  • Опыт работы с системами мониторинга (Prometheus, Grafana)
  • Понимание сетевого стека: DNS, Ingress, балансировка
  • Опыт развертывания и поддержки Apache Airflow в Kubernetes
  • Опыт деплоя Apache Spark в Kubernetes (spark-operator)
  • Опыт работы с Trino / Presto

Будет плюсом:

  • Опыт с Apache Kafka (деплой, обслуживание)
  • Базовые знания SQL и понимание работы СУБД
  • Опыт работы с metadata-каталогами (OpenMetadata, DataHub)
  • Опыт работы в финансовом секторе

Мы предлагаем:

  • Конкурентная заработная плата, годовая премия
  • Оформление согласно ТК РФ, выплаты 5 и 20 числа каждого месяца
  • Пятидневка с «короткой» пятницей
  • Культура открытости, наставничества и взаимопомощи
  • Возможность прокачать свои компетенции, повысить свою экспертизу, работая над сложными и интересными проектами
  • Внешние мероприятия, включая конференции и форумы
  • Карьерные перспективы в рамках компании и экосистемы Сбера
  • Выгодные программы кредитования и вкладов в Сбере
  • Льготная ипотека, в т.ч. рефинансирование
  • СберКарта с бесплатным обслуживанием и кэшбэком до 10% бонусами СберСпасибо
  • Доступ в СберКлуб: корпоративные скидки и программы от партнеров экосистемы Сбера
  • Бесплатная подписка «СберПрайм+» (Окко, Сбермобайл, СберЗвук, бесплатные доставки и скидки сервисов Сбера (Delivery, СберМаркет, СберМегаМаркет и т.д.)
  • Скидка в СберСтрахование
  • Корпоративная пенсионная программа
  • Скидки на онлайн изучение английского языка
  • Активная корпоративная жизнь команды, награды, подарки
  • Комфортный офис в центре Москвы (МЦК / м. Кутузовская): тренажерный зал, оpen-space, кухня, кофемашина и т.д.

    Присоединяйтесь к команде АБК!

Похожие специальности

Хотите персональную подборку?

Введите свои критерии — мы отфильтруем вакансии по вашим требованиям

Найти подходящие вакансии →