AI VK развивает технологии искусственного интеллекта для ключевых продуктов VK, создаёт систему рекомендаций и поиска контента на наших платформах.
Задачи
- Разработка и развитие компонентов ML-платформы и инфраструктурных сервисов
- Автоматизация процессов запуска, сопровождения и мониторинга ML/HPC workloads
- Повышение надёжности, производительности и масштабируемости платформы
- Развитие CI/CD и внутренних инструментов для эксплуатации платформы
- Взаимодействие с командами разработки и ML-инженерами по вопросам платформы и инфраструктуры
Требования
- Опыт разработки инфраструктурных и platform-компонентов на Go
- Углубленные знания Linux, включая понимание работы ОС, сетевого стека и механизмов контейнеризации
- Хорошее понимание сетей, сетевых протоколов и диагностики проблем связности
- Знание архитектуры и принципов работы Kubernetes
- Навыки troubleshooting на всех уровнях инфраструктуры: хост, контейнеры, runtime, сеть
- Опыт автоматизации инфраструктурных процессов и разработки внутренних инструментов
- Понимание принципов надёжности, масштабируемости и observability production-систем
Будет плюсом
- Опыт работы с ML / MLOps / HPC workloads
- Опыт разработки на Python
- Опыт работы с CI/CD, monitoring и platform tooling