
яндекс · 4 июн.
Ищем специалиста, который будет заниматься аналитикой правильности еком-товаров. Вам предстоит отвечать на множество вопросов. Например:
* Как научить ML-модели понимать, что какая-либо из характеристик товара меняется часто?
* Как понять, что цена товара в нашей базе корректная и актуальная?
* Все ли партнёры приносят нам свой ассортимент с правильными характеристиками и ценами?
* Насколько правильная наша товарная база в целом?
Выстраивание системы метрик
Метрики — основа любого продукта. От качества метрик зависит, что в итоге выучат наши ML-модели и в какую сторону будет двигаться продукт. Мы используем систему из офлайн- и онлайн-метрик. Эту систему предстоит улучшать, а для этого нужно понять, где её область применения, какие у неё недостатки и как их исправить.
Сбор офлайн-метрик качества базы
Вам предстоит собирать learn-датасет для ML-моделей и формировать метрики их качества. Для этих задач мы используем краудсорсинг и GPT-разметку.
Приоритизация задач правильности на основе данных
Решить задачу правильности разом для всей товарной базы — проблема сверхсложная. Очень много категорий товаров и нюансов — чтобы учесть их все, нужны большие ресурсы и запас времени. Но есть более важные срезы и задачи, и команде аналитики нужно определять приоритетность.
Больше об аналитике в Яндексе — в канале Yandex for Analytics
* Работали с большими объёмами событийных данных и логами различных сервисов
* Уверенно владеете Python и SQL
* Знаете статистику и теорию вероятностей
* Можете самостоятельно разбираться в данных, находить проблемы качества и причины аномалий
* Участвовали и побеждали в олимпиадах по математике, физике, программированию
* Работали с архитектурой аналитических данных продукта (собирали DWH, витрины)
* Разрабатывали и внедряли новые метрики
* Знаете основы машинного обучения