H
HireSeeker
яндекс

Разработчик Greenplum/Cloudberry в Yandex Cloud

яндекс · 14 янв.

Зарплата не указана

Apache Cloudberry — распределённая отказоустойчивая реляционная база данных с открытым исходным кодом, построенная на архитектуре Massively Parallel Processing (MPP).

Отличительная черта этой БД — зрелость проекта: БД построена на современном ядре PostgreSQL и коде Pivotal Greenplum Database, но с продвинутыми корпоративными возможностями. Cloudberry используют как в качестве универсальной БД, так и для крупномасштабной аналитики и рабочих нагрузок AI/ML.

Разработка ведётся opensource на GitHub. Коммитеры — несколько крупных компаний (из России, Китая и Европы) и индивидуальные разработчики. Мы взаимодействуем с разработчиками из разных стран, умеем технически отстоять свою точку зрения.

Мы много выступаем на различных конференциях и проводим свои. Узнайте больше о команде Yandex Cloud Managed Services на нашем карьерном портале.

В команде Managed Greenplum вы сможете внести значительный вклад в развитие Apache Cloudberry, оптимизируя движок БД и создавая новые эффективные форматы хранения данных. Это уникальная возможность сотрудничать с международным сообществом разработчиков, делиться опытом на конференциях и влиять на будущее крупномасштабной аналитики и AI/ML. См. полный roadmap. Всё это предстоит сделать так, чтобы не ухудшить опыт работы с БД огромного количества разных пользователей. У Greenplum и Cloudberry множество инсталляций по всему миру, они занимают 45-е место в рейтинге DB-Engines.

Подписывайтесь на телеграм-канал Inside Yandex Cloud , чтобы узнать больше про нашу команду и технологии!

Развитие Apache Cloudberry

Вы будете улучшать оптимизатор. Cloudberry уникальна наличием стоимостного оптимизатора двух классов: bottom-up и top-down. Есть пространство для улучшения в обоих.

Кроме того, понадобится поработать над векторным движком и новыми эффективными форматами хранения данных (PAX), а также придумать, как сделать read-only реплику БД в другой зоне доступности.

* Знаете классические алгоритмы и структуры данных
* Работали с Linux
* Уверенно владеете C или C++

* Разрабатывали БД
* Знаете PostgreSQL/Greenplum