Инженер по надежности и непрерывности сервисов

По договоренности


Наша распределенная команда Dev насчитывает более 800 специалистов и разрабатывает собственные продукты с 2012 года – рекламные платформы, игровые сервисы и платформы, мобильные игровые и развлекательные приложения, финтех-продукты и решения.

У нас проектно-ориентированный подход, матричная структура с привязкой специалистов к одному проекту, но при этом мы работаем командой. В работе мы применяем SCRUM, Agile.

Сейчас мы ищем инженер по надежности и непрерывности сервисов в нашу команду.

Обязанности:

— Проведение технической оценки надежности сервисов и проектов;

— Анализ архитектуры, зависимостей, критичных компонентов и точек отказа;

— Оценка мониторинга, алертинга, логирования, трассировки, backup/recovery и DR-практик;

— Оценка эксплуатационной готовности сервисов: runbooks, on-call, postmortem, readiness к инцидентам и релизам;

— Анализ изменений и релизов с точки зрения рисков, rollback и устойчивости;

— Участие в разборе инцидентов и подготовке рекомендаций по повышению надежности;

— Формирование требований к SLI/SLO, качеству алертинга и observability-контуру;

— Подготовка технических требований и сопровождение reliability-улучшений совместно с командами DevOps, эксплуатации и разработки;

— Участие в стандартизации recovery/runbook/reliability-практик и повторной валидации сервисов после изменений.

Требования:
  • Опыт работы в ролях SRE, DevOps, OPS, Production Engineering или архитектуры.
  • Умение разбираться в устройстве сервисов и задавать корректные технические вопросы.
  • Опыт документирования архитектуры и понимание модели C4.
  • Практическое понимание надёжности сервисов (бэкапы, DR, мониторинг, логирование, релизы, rollback, инциденты).
  • Развитые коммуникационные навыки и опыт проведения интервью.
  • Умение формулировать выводы и фиксировать факты.
  • Навыки работы с доказательной базой (дашборды, репозитории, конфигурации, регламенты).

Будет плюсом:

  • Опыт проведения технических аудитов и разработки чек-листов.
  • Опыт создания и внедрения внутренних стандартов.
  • Опыт работы с Prometheus, Grafana, ELK/OpenSearch, Kubernetes, CI/CD.
  • Понимание SLI, SLO и Error Budget.
Условия:
  • Оформление в штат компании или контракт, несколько способов выплат;
  • Remote из любого гео или гибридный офис;
  • Гибкий график - лояльное начало дня с 9.00 до 11.00 по МСК, 8 часов рабочий день + перерывы на отдых на свое усмотрение;
  • Возможность выбрать оборудование, доставим на дом в РФ;
  • Развитие в карьере - внутренняя система грейдов с пересмотром раз в год по Performance Review;
  • Непрерывное обучение: у нас есть внутренняя Академия, а также много партнёрских программ, которые поделятся знаниям не только в профессиональной сфере, но и поддержат твои хобби;
  • Развитая культура коммуникаций: турниры онлайн и оффлайн, тех комьюнити, митапы, co-working дни, встречи и пати на летней веранде, тимбилдинги;
  • Классный офис на Тульской с видом на Москву-реку и летней верандой.

Поделиться:

Опубликована 3 часа назад

Похожие вакансии

Нужны деньги до новой зарплаты? Кредитка Platinum от Т-Банка — до 1 000 000 ₽, 55 дней без %. Доставим сегодня бесплатно.
Получить карту
от 200 000 ₽
Выше средней на 17%
HOSTKEY ищет Site Reliability Engineer (SRE), который возьмёт на себя надежность сложной инфраструктуры ... Нам нужен инженер, способный не просто реагировать на сбои, а выстраивать систему так, чтобы их предотвращать ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании Айти БазисАйти Базис
  • Москва
7 дней назад
Сфера: Ищем дата-инженера в направление развития реферальной программы для юридических лиц.
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании USETECHUSETECH
  • Москва
3 часа назад
Группа будет обеспечивать надежность: · WEB-решения (Кабинет клиента и API к нему – Bitrixи ApachePHP ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании EGAREGAR
  • Москва
3 часа назад
Направление работы Команда развивает внутренние сервисы и платформенные продукты компании для автоматизации, учета, управления доступами, поддержки инфраструктуры и сопровождения внутренних процессов. Среди ключевых продуктов направления: — Service D...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании RWB (Wildberries & Russ)RWB (Wildberries & Russ)
  • Москва
3 часа назад
200 000 ₽
Выше средней на 17%
Удаленная работы по срочному трудовому договору либо ГПХ Срок от 3 до 6 месяцев. Обязательные условия: - Командировки на производство в г. Новомосковск (оплачиваем жилье + суточные) - Периодические выезды в установочный центр (Москва) О компании MBS ...
  • Можно удаленно
  • Полный день
  • Опыт от 3 лет
Логотип компании МБСМБС
  • Москва
3 часа назад
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.