Мониторинг доступности и производительности серверов, сетевого оборудования, баз данных, приложений с использованием систем мониторинга (Zabbix, Prometheus, Grafana).
Выявление отклонений от штатной работы, критических событий, сбоев.
Приём и фиксация сигналов о сбоях, рисках, инцидентах от систем мониторинга, пользователей, смежных подразделений.
Оповещение ответственных лиц и подразделений при возникновении нештатных ситуаций.
Координация действий участников инцидента, обеспечение связи между подразделениями.
Ведение журнала событий и инцидентов с фиксацией времени, участников, принятых решений и хода устранения.
Помощь в формировании отчётов по инцидентам.
Подготовка информационно-справочных материалов для руководства по оперативной обстановке.
Участие в плановых учениях и тренировках по отработке действий при инцидентах.
Ведение оперативной документации, инструкций по действиям при типовых инцидентах (runbooks).
Актуализация базы знаний ситуационного центра.
Требования:
наличие высшего образования по направлению IT (рассмотрим выпускников последних курсов IT направлений);
знание операционных систем Windows, Linux (базовый уровень);
знание основ сетевых технологий (TCP/IP, DNS, DHCP);
опыт работы с системами мониторинга (Zabbix, Prometheus, Grafana) будет преимуществом;
навыки работы с системами учёта заявок (Service Desk, Jira Service Management);
умение быстро анализировать информацию и принимать решения в нештатных ситуациях.
Будет преимуществом:
наличие сертификаций: ITIL Foundation, Network+, CompTIA Security+.
Условия:
Работа в крупной стабильной организации, получение уникального опыта.
Самый современный кампус в Европе, множество уютных кафе и коворкингов.
Большое количество научных и культурных мероприятий.
Обширные возможности профессионального развития, программы повышения квалификации, посещение образовательных мероприятий и лекций, возможность изучать иностранные языки.
Спортивные и тренажерные залы на территории университета.