SRE-инженер

По договоренности

  • Динамо
  • Белорусская
  • Маяковская

На этой позиции тебе предстоит:

  • Проектировать, разрабатывать, внедрять и поддерживать SLO/SLI для всех сервисов;
  • Участвовать в устранении инцидентов - в связке со смежными командами устранять сбои и предотвращать их повторение;
  • Участвовать в заполнении и разборе постмортемов;
  • Расследовать причины инцидентов (RCA);
  • Разрабатывать и выполнять меры, направленные на предотвращение повторных инцидентов;
  • Развивать мониторинг и алертинг - разработка, обогащение, настройка метрик, логов, трейсов, алертов, дашбордов, ранбуков (и их регулярный анализ/рефакторинг);
  • Автоматизировать рутинную работу;

Что мы ждем от кандидата:

  • Экспертные знания в эксплуатации Linux, включая диагностику на уровне ядра (процессы, память, сеть);
  • Опыт работы с Kubernetes и понимание его internal'ов для диагностики сложных проблем;
  • Понимание, как работают сети и умение диагностировать проблемы в их работе;
  • Практический опыт IaаC (Terraform/Ansible) и понимание принципов;
  • Практический опыт построения CI/CD (Gitlab CI, Argo CD);
  • Умение писать автоматизацию и скрипты на Python/Go;
  • Опыт работы с системами мониторинга и логирования (Prometheus, Grafana, Loki, Tempo, ELK);
  • Понимание, что такое SLO и SLI и умение применять их на практике;
  • Уверенный опыт в SRE/Platform/DevOps роли.

Будет плюсом, если вы:

  • Имеете практический опыт работы SRE;
  • Знаете, как сделать отказоустойчивый масштабируемый сервис;
  • Имеете опыт написания и ревью технической документации;
  • Обладаете системным мышлением и умением анализировать сложные сценарии отказа, выявлять корневые причины, находить способы их устранения.


Адрес: Россия, Москва, 2-я Звенигородская улица, 28
Показать на большой карте

Поделиться:

Опубликована 23 дня назад

Похожие вакансии

Ключевые задачи: Анализ поступающих технических заданий на предмет реализуемости; Участие в проектах по внедрению и сопровождению информационных систем заказчиков (базовые сетевые сервисы, почтовые системы, службы каталогов и т.д.); Участие во внутре...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании SoftlineSoftline
  • Москва
4 дня назад
«Русский Экспресс» — крупный туристический холдинг, предлагающий пакетные и динамические туры, индивидуальные маршруты любой сложности, а также отдельные услуги по всему миру. «Русский Экспресс» имеет репутацию надежной и устойчивой компании, входит ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Русский ЭкспрессРусский Экспресс
  • Москва
6 дней назад
Мы ищем опытного и увлеченного DevOps/SRE инженера, который готов взять на себя ответственность за настройку ... deb), опыт от 2х лет, эксплуатация HighLoad систем; Не менее 3-х лет опыта работы в роли DevOps/SRE инженера ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РостелекомРостелеком
  • Москва
4 дня назад
... принести нам свою уникальную экспертизу в ML/AI, так и развиваться в интересном для себя направлении — от инженера ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании РБКРБК
  • Москва
4 дня назад
100 000 - 150 000 ₽
ООО «МАГМА» — строительная компания с проектами в более чем 20 регионах России, включая Север и Западную Сибирь (8 объектов в работе). Приглашаем кандидатов с опытом, кто готов работать и развиваться в этом направлении. 2 вакансии (на удаленную работ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МАГМАМАГМА
  • Москва
4 дня назад
Обязанности: Разработка, развитие и поддержка CI/CD процессов с нуля; Работа с Kubernetes-кластерами и Linux-серверами; Развертывание и настройка Kubernetes, Kafka и сопутствующего ПО; Настройка мониторинга, логирования и балансировки; Автоматизация ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании ГРЧЦ, ФГУПГРЧЦ, ФГУП
  • Москва
4 дня назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.