Site Reliability Engineer в VK Cloud
По договоренности
Задачи
- Участие в проектировании и внедрении практик управления инфраструктурой
- Разработка и поддержка автоматизированных систем для реагирования на инциденты, мониторинга и оповещения
- Выполнение плановых регламентных работ
- Участие в on-call дежурствах, в инцидент-менеджменте
- L3 поддержка пользователей
- Подготовка технической и эксплуатационной документации
Требования
- Опыт работы системным администратором или SRE от трёх лет
- Опыт работы с операционными системами семейства Linux на уровне администратора (RHEL, CentOS, RedOS)
- Опыт работы с облачной инфраструктурой (VK Cloud, Yandex Cloud, AWS)
- Опыт работы с инструментами мониторинга (Prometheus, Grafana, ELK stack)
- Опыт работы с СУБД на уровне администратора (MariaDB, PostgreSQL)
- Опыт работы с инструментами автоматизации (Ansible, Terraform)
- Опыт работы с технологиями виртуализации (KVM)
- Опыт работы с технологиями контейнеризации (Kubernetes, Docker), базовые знания
Адрес: Россия, Москва, Ленинградский проспект, 70
Опубликована 18 часов назад
Похожие вакансии
Сейчас мы в поиске Middle+ Site Reliability Engineer для работы над крупными ИТ-проектами одного из ведущих ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
4 дня назад
Сейчас мы ищем Site Reliability Engineer (SRE), который будет отвечать за стабильность, производительность ... ниже B1 (уверенное чтение технической документации); Опыт работы в роли SRE / DevOps / Infrastructure Engineer ...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад
Чем предстоит заниматься: Поддержка работоспособности систем страховой платформы. Выкатка релизов. Развёртывание и поддержка prod/stage/dev сред. Написание Terraform модулей для развёртывания инфраструктуры. Написание Ansible ролей. Обслуживание Kube...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад
Что предстоит делать: Обеспечение мониторинга и стабильной работы сервисов (облачная система управления отелями Sonata PMS). Реакция на инциденты и участие в их расследовании. Автоматизация процессов развертывания и эксплуатации. Улучшение отказоусто...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
21 день назад
до 240 000 ₽
Мы укрепляем нашу команду и ищем сильного Site Reliability Engineer (SRE) с опытом работы от 3 лет.
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
8 дней назад