DevOps-инженер
от 300 000 ₽
- Динамо
- Белорусская
- Маяковская
Мы ищем Middle/Senior DevOps-инженера, который присоединится к нашей команде для построения и развития надежной, масштабируемой и безопасной инфраструктуры.
Чем предстоит заниматься:
-
Развитие инфраструктуры: Проектировать, развивать и поддерживать приложения в собственных контурах с использованием принципов IaC.
-
K8s: Разворачивать и приводить к стандарту k8s-кластеры (сети, ingress, storage, секреты, autoscaling).
-
CI/CD: Настраивать и поддерживать эффективные процессы непрерывной интеграции и доставки (CI/CD) на основе GitLab Flow.
-
Автоматизация: Автоматизировать рутинные операции с помощью Ansible, Terraform.
-
Мониторинг и логи: Развивать систему мониторинга и сбора логов (Grafana, ELK-stack) для оперативного контроля и предотвращения инцидентов.
-
Техническая поддержка: Участвовать в устранении инцидентов (troubleshooting) на всех уровнях стека — от сети и ОС до приложений.
Требуесый опыт (3+ лет на позициях DevOps/SRE):
-
Kubernetes: администрирование production кластеров, работа с Helm, ArgoCD, понимание Service Mesh (Istio).
-
Умение работать с Bare-metal и работать не с облачными managed-решениями.
-
Автоматизация и IaC: практический опыт Terraform, Ansible.
-
CI/CD: опыт настройки пайплайнов GitLab CI, Jenkins, понимание Gitlab Flow, trunk-based development.
-
Мониторинг: навыки настройки Prometheus, Grafana, ELK Stack, опыт с observability инструментами.
-
Программирование: уверенные навыки Python и Bash.
-
Сетевые технологии: TCP/IP, DNS, HTTP, NAT, знание принципов работы сетевых устройств.
-
Опыт построения отказоустойчивых конфигураций Kafka, Redis.
Будет плюсом:
-
Опыт с высоконагруженными системами (highload).
-
Опыт программирования Go.
-
Сертификации: AWS Certified DevOps Engineer, Azure Administrator, GCP Professional Cloud Architect.
-
Опыт в Machine Learning / Data Platform инженерии.
Цели команды и метрики успеха:
-
TTFD (Time To First Deployment): разработка нового сервиса или фичи выходит в production за часы, а не дни или недели.
-
MTTR (Mean Time To Recovery): стабильное снижение времени восстановления после инцидентов.
-
Alarmfatigue prevention: алерты без шума, каждый alert действителен, настроены runbooks и playbooks для автоматизированного реагирования.
-
IaC-покрытие инфраструктуры: 90%+ кода инфраструктуры в версионной системе (Git).
-
Disaster Recovery: регулярные DR-тесты в заданные RTO/RPO, документирование стратегии восстановления.
-
Автоматизация: минимизация ручных операций, экономия ресурсов, снижение операционных затрат (CapEx/OpEx).
Сравнение со средней зарплатой в похожих вакансиях:
245k
300k
200k
471k
Опубликована 11 часов назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва