llp_qazcloud · Астана · 5 июн.
MLOps-инженер LLP QazCloud
Местоположение: Астана
Формат работы: Гибрид
Опубликована: 01.06.2026
Требования:
• Деплой и обслуживание LLM (vLLM)
• Работа с Triton Inference Server
• Управление GPU-кластером (CUDA MPS)
• Строительство CI/CD для AI-сервисов
• Опыт с Kubernetes, Docker
• Мониторинг GPU метрик
• Работа с реляционными и векторными БД
Вакансия опубликована в LinkedIn у Nurlan Nurmash