
dogma · Москва · 17 июн.
Ценообразование и аналитика продаж
Разработка и обучение модели динамического ценообразования: CatBoost/XGBoost на исторических данных сделок — прогноз базовой цены лота с учётом строиготовности, локации, типологии
Анализ зависших лотов: модель выявляет объекты с аномально низким темпом продаж и предлагает ценовую коррекцию
Прогноз темпов продаж по каждому ЖК на горизонт 3–6 месяцев — на вход данные из DWH, парсинга конкурентов и внешних макрофакторов
Мультигородская аналитика: сравнение динамики спроса и цен в 7 городах присутствия DOGMA для выбора локации новых проектов
Интеграция ценовой модели с BI Superset через FastAPI — рекомендации отображаются в дашборде в реальном времени
AI-подборщик квартир (dogma.ru)
Разработка алгоритма рекомендаций для сайта dogma.ru: collaborative filtering + контентные признаки (площадь, этаж, вид, планировка, цена)
Сбор и подготовка датасета: поведенческие данные пользователей сайта (клики, время просмотра, заявки) из DWH
A/B тестирование алгоритма совместно с Data Analyst: метрика успеха — +20% CTR на карточку квартиры
Деплой через FastAPI-эндпоинт, подключение Backend Developer — алгоритм работает в реальном времени на сайте
Речевая аналитика (Департамент продаж)
Построение пайплайна анализа звонков: Whisper / SpeechKit STT → транскрипт → LLM-классификатор → структурированный отчёт
Разработка LLM-классификатора нарушений скриптов: модель определяет отклонения по чеклисту, формирует рейтинг менеджеров
Пилот на 100 звонках ОПТ — валидация качества транскрипции и классификации перед промышленным запуском
Настройка голосового диспетчера для управляющей компании: маршрутизация входящих обращений жителей без участия оператора
Метрика успеха: −40% нарушений скриптов, −30% нагрузки на колл-центр
Видеоаналитика стройконтроля
Разработка CV-пайплайна на YOLOv8: детекция нарушений СИЗ (каски, жилеты), открытых проёмов, строительного мусора на площадке
Подключение и настройка потока с IP-камер на строительных объектах DOGMA
Разработка системы автоматических штрафов: нарушение зафиксировано → алерт → запись в систему → штраф подрядчику
Построение рейтинга подрядчиков на основе накопленной статистики нарушений
MVP за 5 месяцев, промышленное внедрение — 11 месяцев. Метрика: −35% нарушений на площадке
RAG-системы и LLM-инициативы
ГОСТ-ревизор: RAG-система проверки проектной документации до экспертизы — поиск ошибок и несоответствий по базе ГОСТ/СП/СанПиН. Стек: локальная LLM (Qwen) + RAG + ClickHouse. Метрика: −30% замечаний экспертизы
AI-планировщик секций: интеграция Maket.ai API — генерация готовых планировок в заданных пятнах, создание новых типологий. Метрика: −40% времени на пятнографию и ОПР
Финансовые модели: LLM-суммаризатор выявляет отклонения в финмоделях, предлагает рекомендации по оптимизации на основе аналогов. Метрика: +3× выявленных отклонений
Нормативный мониторинг: LLM + парсинг pravo.gov.ru — автоматическое отслеживание изменений в СП, СанПиН, ФЗ с формированием сводок. Метрика: 0 дней задержки обновления нормативной базы
AI-скоринг лидов
Разработка CatBoost-модели скоринга лидов: предсказание вероятности сделки по параметрам клиента, источнику, поведению на сайте
Подготовка фичей: история взаимодействий из CRM (Битрикс24) через Data Engineer, поведенческие данные из DWH
Интеграция с CRM через Backend Developer: скоринг лида появляется в карточке Битрикс24 автоматически
Метрика успеха: +15–25% конверсии лид → сделка
SmartHome и предиктивное обслуживание (Фаза 3)
Предиктивное обслуживание лифтов: ML-модель на данных сенсоров предсказывает аварийные ситуации за 4–6 недель до срыва. Метрика: −40% аварийных ситуаций
AI-аналитика потребления ресурсов: IoT-данные (вода, свет, тепло) → предиктивное обслуживание общедомового оборудования
Цифровой двойник объекта: YOLOv8 + BIM API + DJI SDK — динамическая виртуальная копия стройплощадки, прогноз задержек, автоперестройка графика. Метрика: −20% задержек объектов
Эксперименты и качество моделей
Логирование всех экспериментов в MLflow: параметры, метрики, артефакты — версионирование каждого обученного прогона
A/B тестирование моделей в проде совместно с Data Analyst: challenger vs champion, принятие решения о смене модели только по статистически значимым результатам
Мониторинг дрейфа данных совместно с MLOps: алерт при деградации качества модели ниже порогового значения
Написание понятных README и карточек моделей: что модель делает, на каких данных обучена, какие ограничения
Документация и процессы
Документирование каждой модели: постановка задачи → данные → архитектура → метрики → ограничения
Участие в техническом планировании совместно с Data Engineer: какие данные нужны и в каком формате ещё до начала разработки
Передача ML-моделей MLOps для деплоя: оформленный Docker-образ + FastAPI-эндпоинт + описание зависимостей
Участие в Sprint Review: демонстрация результатов обучения и метрик бизнес-заказчику понятным языком
Python 3.x — основной язык, уверенный уровень: ООП, типизация, работа с async
CatBoost / XGBoost / Scikit-learn — продакшн опыт: обучение, настройка гиперпараметров, оценка качества, интерпретируемость
PyTorch — обучение и fine-tuning нейросетей, понимание градиентного спуска и backprop
LLM и RAG pipeline — Langchain или LlamaIndex: построение систем с контекстом документов, векторные базы (Chroma, Weaviate, FAISS)
Computer Vision — YOLOv8 или аналог: детекция объектов, трекинг, работа с видеопотоком
FastAPI — оборачивает модели в REST API, понимает асинхронность и обработку ошибок
SQL / ClickHouse — самостоятельно выгружает данные для обучения, не зависит от Data Engineer для базовых запросов
Docker — упаковывает модели в образы для передачи в MLOps
MLflow или ClearML — трекинг экспериментов, версионирование моделей, сравнение прогонов
Понимание 152-ФЗ — какие данные являются ПДн, какие модели нельзя обучать на открытых облачных сервисах
Дополнительно:
Whisper / SpeechKit STT — транскрибация аудио, работа с русскоязычной речью
Локальные LLM — развёртывание и запуск Qwen, Mistral, GigaChat через Ollama / vLLM
BIM API / Maket.ai API — интеграция с проектными инструментами (Фаза 3)
Midjourney API / Stable Diffusion — генерация визуализаций (nice to have для Деп. стратегии)
OR-Tools — оптимизация расписаний и графиков (AI-планировщик секций)
Yandex Cloud ML — понимание GPU-инфраструктуры, SageMaker-аналоги в российском стеке.
В Dogma Вас ждут: