Инженер мониторинга и надежности (Monitoring & Reliability Engineer)

По договоренности


CommCloud — аккредитованная ИТ-компания, сопровождающая High Load и High Availability-системы ведущих финансовых организаций России уже более 5 лет.
Мы растём, расширяем портфель решений и выходим в новые отрасли.

В распоряжении команды — более 10 коммерческих дата-центров по России, партнёрство с топ-поставщиками оборудования и ПО, современные облачные решения и стек из 1000+ технологий.
Чтобы всё это работало стабильно и предсказуемо, мы развиваем внутренние практики на базе лучших мировых подходов к управлению ИТ-инфраструктурой.

Чем предстоит заниматься

  • Поддержка и развитие систем мониторинга: Prometheus, Grafana, Zabbix

  • Настройка алертинга и dashboards

  • Сбор, обработка и анализ логов (Opensearch)

  • Работа с метриками, логами и трейсам

  • Расчёт и контроль SLA / SLO / SLI

  • Работа с инцидентами и постмортем-анализом

  • Обеспечение отказоустойчивости систем мониторинга

  • Построение мониторинга высоконагруженных систем с нуля


Требования

  • Высшее образование в области ИТ, компьютерных наук или смежных направлениях

  • От 5 лет опыта в SRE, DevOps или системном администрировании

  • Глубокое понимание принципов надёжности, мониторинга и управления инцидентами

  • Опыт работы с Prometheus, Grafana, Zabbix и системами обработки логов (Opensearch, Elasticsearch и т.п.)

Будет плюсом

  • Опыт работы или понимание AIOps

  • Знание сетевых технологий (TCP/IP, HTTP, gRPC)

  • Опыт performance tuning инструментов мониторинга

  • Опыт работы в системных интеграторах


Условия

  • Удалённый формат работы, график 5/2

  • Гибкий старт рабочего дня

  • Официальное трудоустройство по ТК РФ

  • Компания аккредитована в Минцифре

  • Возможность влиять на архитектуру и развитие мониторинга

  • Дружная команда без микроменеджмента

  • Мягкая адаптация и поддержка на старте


Поделиться:

Опубликована 19 часов назад

Вакансия в подборках

  1. Инженер
  2. Инженер ТО
  3. IT engineer

Похожие вакансии

  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
  • Москва
19 часов назад
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
  • Москва
22 дня назад
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
  • Москва
2 дня назад
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
  • Москва
3 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.