
ozon · Москва · 14 июн.
Привет! Это команда DWH, мы находимся в поиске разработчика аналитического хранилища Ozon, умеющего работать с большими данными, оптимизировать SQL запросы, строить ETL процессы, разбирать ошибки, общаться с бизнес-пользователями и аналитиками.
Наш стек
Vertica, Hadoop, Spark, Jupyter Notebook, Python, Airflow, Docker.
Вы будете
Разрабатывать и развивать ETL-системы, обслуживающие информацию для различных предметных областей: продажи, учёт, логистика.
Анализировать данные, заниматься дизайном структур данных для аналитических потребностей различных бизнес-подразделений.
Оптимизировать и мониторить pipeline обработки данных – мы следим за нашими инструментами и хотим чтобы они работали максимально производительно.
Заниматься дизайном и реализацией масштабируемого хранилищ на базе HP Vertica, Trino, ClickHouse, PostgreSQL, Hadoop.
Нам важно
Хорошие умения проектировать и реализовывать ETL-процессы. Обязательно знание AirFlow. Наши бизнес-процессы многообразны и постоянно эволюционируют, что сказывается на ETL-процессах.
Отличные знания SQL и наличие системного мышления.
Опыт разработки хранилищ данных с одной из колоночных СУБД: Vertica, Greenplum, Exadata, Teradata. Отдел BI проектирует и реализует аналитическую модель предприятия, с которой удобно работать пользователям. Эти навыки помогают нам строить хранилища данных эффективно.
Наличие опыта программирования на Python для разработки решения автогенерации задач ETL и способность реализовать логические алгоритмы.
Навыки работы с Bash, Docker.
Самостоятельность в решении поставленных задач. Наличие опыта ключевым разработчиком на крупном проекте. Проектирование архитектуры хранения и связанного ETL. Экспертное управление техническими требованиями к проекту, с аргументацией правок и предложениями свежих решений.
Будет плюсом
Опыт работы со Spark.
Опыт работ работы с несколькими инструментами ETL и навыки использования их в горизонтально масштабируемых инструментах обработки данных. Наша компания ежегодно испытывает двукратный рост по объёму данных. Мы даём возможность применять в работе эти инструменты.
Знания в одной из областей: CI/CD, фронтенд/бэкенд разработка, разработка интеграционных потоков.
Желание попробовать свои силы в управлении проектом и выводить в production фичи, за которые вы будете испытывать гордость.
Желание быть наставником в команде.