H
HireSeeker
united developers

ML Engineer (PySpark)

united developers · Удалённо · 27 апр.

Зарплата не указанаremote
Открыть на Hirify

Вакансия: ML Engineer - Clustering (PySpark)

Компания: United Developers

Мы - United Developers, международная IT-компания с более чем 10-летним опытом в разработке и поддержке мобильных решений для клиентов из Европы и США. Наша ключевая экспертиза - создание сложных мобильных приложений для IoT (Internet of Things) и интеграция AI/ML в продукты для бизнеса и стартапов.

Ищем ML-инженера на проект для американской energy-tech компании (B2B SaaS, 35+ крупных энергокомпаний США в клиентах).

Задача:

Построить production-систему кластеризации ~1M домов на PySpark, которая группирует похожие дома для peer comparison в Home Energy Reports.

Стек:

Python, PySpark, sklearn, pandas. Production ML pipelines.

Что нужно делать:

  • Rule-based сегментация с адаптивным выбором фич под разреженные данные.
  • Similarity-based кластеризация внутри сегментов (target ~100 домов/кластер).
  • Обработка mixed-type данных (числовые + категориальные + булевы с 40% пропусков).
  • Framework валидации кластеров (29 quality checks по спеку клиента).
  • Интеграция с geo-данными (lat/lon, ZIP, county).

Требования:

  • Уверенный PySpark в production (не курсы, реальный опыт).
  • Опыт кластеризации - понимаешь tradeoffs между partitioning / hierarchical / density-based.
  • Работа с sparse mixed-type данными.
  • Английский от B2 (созвоны с клиентом)!

Условия:

  • Part-time, ~20ч/нед.
  • Удалённо.
  • Старт: конец апреля - начало мая 2026.
  • Оплата почасовая, обсуждается.
  • Длительность: 2-3 месяца (PoC + production build).