H
HireSeeker
сбер

ML Engineer (ASR, GigaChat Data)

сбер · г Москва · 15 июн.

↑ Вакансия с автоподнятием
Зарплата не указана

Мы — команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях (Text, Vision, Audio): SFT, RLHF, навыки, безопасность и продуктовые сценарии.

Сейчас ищем специалистов в данные под проекты, связанные с ML на устройствах: офлайн-ассистент, локальное ASR, keyword spotting, VAD/EOU и персонализация.

Направления задач:

  • Данные для on-device ассистента - Сбор и подготовка данных для валидации и обучения локальных компонентов: ASR, spotter, VAD/EOU.
  • Пайплайны данных - Построение процессов сбора, очистки, сегментации и разметки данных, включая работу с сырыми аудиоканалами и логами с устройств.
  • Разметка и схемы аннотации - Проектирование и внедрение разметки для новых сценариев: офлайн-команды, EOU, VAD, персонализация.
  • Данные под новые фичи - Подготовка датасетов для offline ASR, quick commands, offline assistant и персонализации.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

  • подготовка данных для обучения и тестирования моделей

  • разработка и поддержка data pipeline’ов

  • анализ качества моделей через данные и метрики

  • поиск точек роста и проблемных сценариев

  • работа с продовыми и beta-логами устройств.

  • уверенный Python (алгоритмы, структуры данных, async)

  • опыт работы с данными в ML-задачах

  • понимание метрик качества моделей

  • базовая статистика

  • опыт в speech-задачах (ASR, VAD, diarization, keyword spotting)

  • опыт построения data pipeline’ов

  • опыт с разметкой и краудсорсингом.

  • крупнейшее DS&AI community — более 600 DS-специалистов банка

  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира

  • возможность быть соавтором НИРов и статей для международных конференций

  • возможность выбрать удобный формат работы: гибрид или офис

  • ежегодный пересмотр зарплаты, годовая премия

  • корпоративный спортзал и зоны отдыха

  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития

  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа

  • ипотека выгоднее до 7% для каждого сотрудника

  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров

  • вознаграждение за рекомендацию друзей в команду Сбера.