
сбер · Москва · 9 июн.
Мы команда исследователей и инженеров, разрабатывающих технологии post-training (SFT, RL) и контролируемой генерации для моделей генерации изображений, видео и омни-модальных. Мы сфокусированы на повышение качества, управляемости и устойчивости генеративных моделей с помощью методов RLHF / RLAIF и инструктивного редактирования. Помимо фундаментальных исследований, мы создаём прикладные решения для B2B-партнёров от системы генерации интерьера до системы генерации персонализированных аватаров.
Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!
проектирование и обучение высокопроизводительных диффузионных моделей (R2V, R2I, R2V+A) для редактирования и генерации видео / изображений
разработка новых подходов и архитектурных решений для post-training фазы диффузионных моделей: RLHF (PPO, DPO и др.), RLAIF, SFT
разработка, масштабирование и поддержание RL пайплайнов
руководство экспериментами: постановка гипотез, разработка протоколов, анализ результатов
проведение code review, менторинг младших исследователей и инженеров, участие в планировании исследовательской дорожной карты
взаимодействие с командами Pretraining, Data, Infrastructure, Production для масштаб пайплайнов и повышения стабильности моделей в продакшене
поддержание и внедрение SOTA-подходов: мониторинг литературы (arxiv, NeurIPS, ICML, CVPR, ICLR), инициирование внутренних исследований.
бакалавриат/магистратура по направлению компьютерных наук/прикладной математике/ машинному обучению или близких к ним
3+ лет релевантного опыта исследований и разработки в области глубокого обучения/компьютерного зрения/генеративного ИИ
глубокие знания в Computer Vision и Generative Modeling: Diffusion Models, GANs, VAEs, Flow/Rectified Flow Matching
опыт работы с современными диффузионными фреймворками (Diffusers) и моделями FLUX, Wan 2.X и др.)
уверенное владение PyTorch и навыки распределённого обучения (DDP/FSDP)
понимание и практическое применение RL и RLHF ( PPO/DPO и др.)
умение проектировать архитектуры, планировать эксперименты и интерпретировать результаты.
крупнейшее DS&AI community — более 600 DS-специалистов банка
дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
возможность быть соавтором НИРов и статей для международных конференций
возможность выбрать удобный формат работы: гибрид или офис
ежегодный пересмотр зарплаты, годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
ипотека выгоднее до 7% для каждого сотрудника
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбера.