Старший инженер по разработке инфраструктуры

По договоренности

  • Аэропорт
  • Динамо
  • Белорусская

Чем предстоит заниматься:

- Непрерывным мониторингом инфраструктуры и приложений, настройкой и поддержкой алертов;
- Настройкой и оптимизацией коллекторов метрик (Node Exporter, cAdvisor, JMX, приложения, API-запросы и т.д.);
- Диагностикой инцидентов, проведением пост‑мортемов, разработкой автоматических действий при сбоях (auto‑remediation);
- Интеграцией мониторинга с CI/CD, CMDB, системой ServiceDesk, системами оповещения;
- Помощью в определении метрик, установке Service‑Level Indicators (SLI) и Service‑Level Objectives (SLO);
- Проведением воркшопов, обучением коллег работе с дашбордами и системами алертинга;
- Поддержанием актуальной документации (архитектура мониторинга, процедуры реагирования);
- Разработкой и внедрением best‑practice по мониторингу и observability.

Что мы ожидаем:

- Опыт работы от 3 лет в роли инженера мониторинга, SRE или DevOps (с акцентом на систему мониторинга);
- Глубокое понимание принципов работы систем мониторинга: Zabbix, Prometheus, Grafana, Alertmanager;
- Опыт настройки мультисайтовой или геораспределённой системы мониторинга;
- Опыт настройки и масштабирования Prometheus (включая кастомные экспортеры, relabeling, remote write/read, Thanos/Cortex);
- Уверенное владение Grafana: создание сложных дашбордов, использование переменных, визуализация, темы, шаринг;
- Понимание архитектуры и практик микросервисной среды (containerization, Kubernetes, Helm);
- Опыт работы с Kubernetes (настройка мониторинга для подов, нод, сервисов, использование kube-state-metrics, cAdvisor);
- Знание языков и инструментов: Bash, Python, JSON, YAML, REST API;
- Умение работать с системами управления конфигурациями (Ansible, Terraform, SaltStack);
- Опыт работы с системами оповещения и управления инцидентами (в т.ч. через API);
- Навыки анализа логов и метрик;
- Понимание принципов SLI/SLO, error budget, incident management;
- Ответственность, аналитическое мышление, умение работать в команде и документировать процессы

Мы предлагаем:

- ⁠Работу в аккредитованной ИТ-компании;
- ⁠Шаг в космос - для тех, кто вдохновлен идеей покорения космоса и мечтает быть к этому причастным;
- Комфортный офис на метро "Динамо" с графиком 5/2 (с 10 до 19) в гибридном формате;
- ⁠Оформление в соответствии с ТК РФ;
- ⁠Конкурентный уровень заработной платы - на уровне лидеров ИТ/телеком-индустрии.


Адрес: Россия, Москва, Большая кольцевая линия, метро Петровский парк
Показать на большой карте

Поделиться:

Опубликована 2 дня назад

Похожие вакансии

Сейчас мы находимся в поиске Старшего инженера по автоматизированному тестированию в Стрим МТС Инвестиции ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МТС БанкМТС Банк
  • Москва
2 дня назад
Ищем Старшего инженера мониторинга информационной безопасности.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Ecom.techEcom.tech
  • Москва
21 час назад
ЗОНА ОТВЕТСТВЕННОСТИ: Проектирование базовой архитектуры платформы данных: слои STG → DWH → Data Marts по методологии Data Vault. Построение отказоустойчивых конвейеров загрузки данных из внутренних систем (1С ERP, HR, финансы, производственные систе...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ЮматексЮматекс
  • Москва
5 дней назад
Приглашаем в команду Сетевого инженера (CCNP) на сменный график работы.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании StormWall™StormWall™
  • Москва
2 дня назад
Рositive Technologies — компания с двадцатилетней историей в сфере информационной безопасности.Мы разрабатываем продукты и сервисы в области противодействия современным киберугрозам. Создаем решения и технологии, которые защищают от злоумышленников и...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Positive TechnologiesPositive Technologies
  • Москва
9 дней назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.