
нижегороднефтегазпроект · Нижний Новгород · 8 часов назад
В связи с созданием нового отдела и развитием направления, мы формируем команду с нуля.
Важно: На начальном этапе вам предстоит самостоятельно выстроить архитектуру хранения данных и процессы ETL. Проект уникален для компании, поэтому мы ищем специалиста, который не боится «зеленого поля», готов принимать самостоятельные решения и брать на себя ответственность за разработку ключевых узлов системы.
Чем предстоит заниматься:
Проектирование и развертывание БД: Спроектируете структуру локальной базы данных под хранение и индексацию массива данных до 1 500 000 файлов (объем до 2 ТБ и более) с учетом горизонтального расширения в будущем.
Разработка инструментов миграции: Напишете скрипты для автоматического сбора, парсинга, очистки и загрузки файлов из сетевых корпоративных папок в новую систему.
Интеграция с OCR: Настроите взаимодействие ядра БД со специализированным софтом для распознавания текста.
Организация поиска: Внедрите инструменты быстрого полнотекстового поиска, а также поиска по атрибутам (шифр, дата, автор, тип документа).
Подготовка витрин данных: Спроектируете и реализуете выгрузку структурированных данных в форматах, удобных для дальнейшего использования специалистами по искусственному интеллекту.
Мы ждем, что вы:
СУБД: Экспертный уровень работы с реляционными СУБД. Глубокое понимание оптимизации сложных запросов, индексации больших объемов текста и настройки производительности.
Опыт миграций: Наличие успешно реализованных проектов по обработке и переносу терабайтных массивов данных из "сырых" источников в структурированное хранилище.
Программирование: Уверенное владение языками программирования для написания высоконагруженных скриптов автоматизации и работы с файловой системой.
API: Опыт создания серверной части для передачи данных на фронтенд или в смежные сервисы.
Инфраструктура: Базовые навыки администрирования для развертывания и изоляции БД в закрытом контуре (без доступа в интернет).
Будет преимуществом:
Опыт интеграции с OCR-системами (Content AI, Abbyy FineReader Server и др.).
Практика работы с движками полнотекстового поиска.
Понимание специфики проектной документации (чертежи, спецификации, текстовые тома ГОСТ).
Что мы предлагаем:
Мы ценим каждого кандидата и внимательно изучаем все резюме. Если ваше резюме будет отобрано, мы свяжемся с вами для личной встречи.
Присоединяйтесь к команде профессионалов!