Site Reliability Engineer в HotBox S3
По договоренности
Задачи
- Обслуживание production-сервисов S3
- Участие в проектировании и внедрении практик управления инфраструктурой
- Разработка и поддержка автоматизированных систем для реагирования на инциденты, мониторинга и оповещения
- Выполнение плановых регламентных работ
- Участие в on-call дежурствах и процессах инцидент-менеджмента
- L3 поддержка пользователей
- Подготовка технической и эксплуатационной документации
Требования
- Опыт системным администратором от двух лет
- Базовое знание: сети, GNU/Linux, мониторинга и логирования (Zabbix/Prometheus/ELK)
- Системы управления конфигурацией (Ansible/Puppet), контейнеризации (Docker/LXC)
- Умение автоматизировать / писать и читать код на базовом уровне (Bash/Python/Go)
Адрес: Россия, Москва, Ленинградский проспект, 70
Опубликована день назад
Похожие вакансии
Вакансии быстро закрываются — подпишитесь на наш канал в MAX сейчас, чтобы видеть их первыми.
Подписаться в MAX Команда Infrastructure Platform предоставляет внутренние инструменты и облачные сервисы как услугу для всех продуктовых команд компании, обеспечивая масштабируемую и надежную основу для разработки. Мы не просто "чиним алерты" — мы проектируем платфор...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад
Сейчас мы в поиске Middle+ Site Reliability Engineer для работы над крупными ИТ-проектами одного из ведущих ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Чем предстоит заниматься: Поддержка работоспособности систем страховой платформы. Выкатка релизов. Развёртывание и поддержка prod/stage/dev сред. Написание Terraform модулей для развёртывания инфраструктуры. Написание Ansible ролей. Обслуживание Kube...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад
Что предстоит делать: Обеспечение мониторинга и стабильной работы сервисов (облачная система управления отелями Sonata PMS). Реакция на инциденты и участие в их расследовании. Автоматизация процессов развертывания и эксплуатации. Улучшение отказоусто...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
2 дня назад
Задачи Участие в проектировании и внедрении практик управления инфраструктурой Разработка и поддержка автоматизированных систем для реагирования на инциденты, мониторинга и оповещения Выполнение плановых регламентных работ Участие в on-call дежурства...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
5 дней назад