- Работа в Москве
- Удаленно
- Инженер мониторинга
- Инженер мониторинга и надежности (Monitoring & Reliability Engineer)
Инженер мониторинга и надежности (Monitoring & Reliability Engineer)
По договоренности
CommCloud — аккредитованная ИТ-компания, сопровождающая High Load и High Availability-системы ведущих финансовых организаций России уже более 5 лет.
Мы растём, расширяем портфель решений и выходим в новые отрасли.
В распоряжении команды — более 10 коммерческих дата-центров по России, партнёрство с топ-поставщиками оборудования и ПО, современные облачные решения и стек из 1000+ технологий.
Чтобы всё это работало стабильно и предсказуемо, мы развиваем внутренние практики на базе лучших мировых подходов к управлению ИТ-инфраструктурой.
Чем предстоит заниматься
-
Поддержка и развитие систем мониторинга: Prometheus, Grafana, Zabbix
-
Настройка алертинга и dashboards
-
Сбор, обработка и анализ логов (Opensearch)
-
Работа с метриками, логами и трейсам
-
Расчёт и контроль SLA / SLO / SLI
-
Работа с инцидентами и постмортем-анализом
-
Обеспечение отказоустойчивости систем мониторинга
-
Построение мониторинга высоконагруженных систем с нуля
Требования
-
Высшее образование в области ИТ, компьютерных наук или смежных направлениях
-
От 5 лет опыта в SRE, DevOps или системном администрировании
-
Глубокое понимание принципов надёжности, мониторинга и управления инцидентами
-
Опыт работы с Prometheus, Grafana, Zabbix и системами обработки логов (Opensearch, Elasticsearch и т.п.)
Будет плюсом
-
Опыт работы или понимание AIOps
-
Знание сетевых технологий (TCP/IP, HTTP, gRPC)
-
Опыт performance tuning инструментов мониторинга
-
Опыт работы в системных интеграторах
Условия
-
Удалённый формат работы, график 5/2
-
Гибкий старт рабочего дня
-
Официальное трудоустройство по ТК РФ
-
Компания аккредитована в Минцифре
-
Возможность влиять на архитектуру и развитие мониторинга
-
Дружная команда без микроменеджмента
-
Мягкая адаптация и поддержка на старте
Опубликована 19 часов назад