Системный инженер (SRE)/Инженер по надежности инфраструктуры
По договоренности
О компании
«Маркетспейс» — ведущий e-commerce дистрибьютор, который работает с Wildberries, Ozon и Яндекс Маркет. Мы управляем огромными товарными потоками, имеем собственный фулфилмент-центр с площадью складов 35 000 м² и обрабатываем более 40 000 заказов в день. Наш бизнес активно растет, поэтому мы ищем Системный инженер (SRE)/Инженер по надежности инфраструктуры.
Кого ищем
Совмещаем роли SRE + классического системного инженера. Главное — стабильность, инженерный подход к эксплуатации и доступность сервисов.
Зоной ответственности будет: SLA/SLO, инциденты, автоматизация, наблюдаемость, снижение TCO, отказоустойчивость, автоматизация, устранение узких мест.
Вам предстоит, на первом этапе, задокументировать то что есть в компании вместе с текущей командой, затем спроектировать и реализовать серию тех.решений, которые позволят снизить риски потери данных и прерывания бизнеса. Следующий этап, принять активное участие в создании единой внутренней платформы, которая объединит усилия множества небольших команд разработки.
Функциональные обязанности
-
Обеспечение надежности, доступности и производительности сервисов.
-
Управление инфраструктурой через код (IaC) и автоматизация развертывания.
-
Построение и развитие наблюдаемости: логирование, метрики, трассировки.
-
Управление инцидентами: реагирование, постмортемы (акты расследования), устранение первопричин.
-
Оптимизация инфраструктурных затрат (TCO) и ресурсов.
-
Разработка и поддержка единого платформенного сервиса компании (ci/cd, kubernetes, сервис‑мэш, обмены, внутренние api).
-
Обеспечение отказоустойчивости и масштабируемости систем.
-
Внедрение и контроль SLA/SLO/SLI.
-
Совместная работа с разработкой и командами бизнеса для повышения качества релизов.
Требования
Высшее техническое образование.
Понимание и умение работать с инфраструктурой как с кодом: ansible, terraform, helm (можно kustomize), gitops‑подход.
Опыт оркестрации и работы с контейнерами: Docker+Kubernetes.
Практический опыт и понимание, как наладить наблюдаемость и логирование: Prometheus+Grafana.
CI/CD - jenkins или gitlab.
Развитие сетей: mikrotik (или другой опыт работы с VPN, сетевыми экранами, маршрутизаторами).
Опыт (базовый) - по работе с СУБД, очередями: PostgreSQL, Redis, RabbitMQ или Kafka (это будет плюсом).
Значительный плюс - практический опыт перехода с MS SQL на PostgreSQL.
Инструменты: python + bash — для автоматизации и утилит.
Условия
-
Удаленная работа,
-
иногда могут быть командировки в г. Смоленск.
Опубликована 2 дня назад
Похожие вакансии
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Смоленск
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Смоленск