Site Reliability Engineer в One Cloud

По договоренности

Москва

One Cloud — центральное внутреннее облако компании собственной разработки, технологический фундамент для всех продуктов компании. Мы предоставляем единую среду запуска приложений, хранилищ, баз данных и любых других сервисов.

Сейчас One Cloud - это ~30 000 серверов в 14 дата центрах, загрузка более 1 000 000 процессорных ядер, объем хранилища в 15 Петабайт и 400 Тбит/сек по сети.

Мы ищем Site Reliability Engineer, готовых разделить с нами задачи по эксплуатации, инцидент-менеджменту, R&D, а также принять технический вызов кратного роста Облака и амбициозности поставленных перед командой задач.

Перед командой стоят задачи развития и масштабирования, повышения надежности и наблюдаемости, автоматизации рутины, разработки внутренних инструментов.

Стек: Linux, Python, Golang, CFEngine, AWX.

Задачи

Эксплуатировать парк серверов облака (в том числе bare metal) — более 30 000 хостов
Постоянно обновлять парк серверов
Осуществлять переезды между датацентрами
Управлять инцидентами — в связке с командами мониторинга и разработки устранять сбои и предотвращать их повторение
Автоматизировать процессы эксплуатации и оркестрации — при наших объёмах задачи решаются через код
Участвовать в разработке и внедрении новой функциональности облака.

Требования

Коммерческий опыт работы в релевантной роли SRE, DevOps, системного инженера от 3х лет
Опыт работы с серверной инфраструктурой на базе Linux
Глубокое понимание как работает ОС на базе linux и как работает ядро linux
Умение в troubleshooting
Опыт работы с сетью — iptables, BGP, VRRP
Опыт работы с SCM — Puppet, Salt, Ansible и тд
Опыт автоматизации на Bash
Умение программировать

Будет плюсом

Опыт работы с системами на базе RHEL
Опыт работы с веб-хостингом — nginx, серверы приложений, MySQL, Postgres
Опыт работы с CFEngine, Cassandra, Zabbix и Vault;
Знание Golang и Java.

⚡ Откликнуться на hh.ru

Опубликована 7 часов назад

Site Reliability Engineer

Команда Infrastructure Platform предоставляет внутренние инструменты и облачные сервисы как услугу для всех продуктовых команд компании, обеспечивая масштабируемую и надежную основу для разработки. Мы не просто "чиним алерты" — мы проектируем платфор...

Можно удаленно
Полный день
Опыт от 3 лет

DODO BRANDS (Dodo Pizza, Drinkit)

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Site Reliability Engineer в HotBox S3

Задачи Обслуживание production-сервисов S3 Участие в проектировании и внедрении практик управления инфраструктурой Разработка и поддержка автоматизированных систем для реагирования на инциденты, мониторинга и оповещения Выполнение плановых регламентн...

Можно удаленно
Полный день
Опыт от 3 лет

Москва

2 дня назад

⚡ Откликнуться на hh.ru

Middle+ Site Reliability Engineer (SRE)

Сейчас мы в поиске Middle+ Site Reliability Engineer для работы над крупными ИТ-проектами одного из ведущих ...

Можно удаленно
Полный день
Опыт от 3 лет

Sibedge

Москва

7 дней назад

⚡ Откликнуться на hh.ru

DevOps Site Reliability Engineer / SRE

Чем предстоит заниматься: Поддержка работоспособности систем страховой платформы. Выкатка релизов. Развёртывание и поддержка prod/stage/dev сред. Написание Terraform модулей для развёртывания инфраструктуры. Написание Ansible ролей. Обслуживание Kube...

Можно удаленно
Полный день
Опыт от 3 лет

Росгосстрах

Москва

7 дней назад

⚡ Откликнуться на hh.ru

Инфраструктурный инженер (Infrastructure Software Engineer/Site Reliability Engineering)

Что предстоит делать: Обеспечение мониторинга и стабильной работы сервисов (облачная система управления отелями Sonata PMS). Реакция на инциденты и участие в их расследовании. Автоматизация процессов развертывания и эксплуатации. Улучшение отказоусто...

Можно удаленно
Полный день
Опыт от 3 лет

HRS

Москва

3 дня назад

⚡ Откликнуться на hh.ru

Site Reliability Engineer в One Cloud

По договоренности

Задачи

Требования

Будет плюсом

Похожие вакансии

Site Reliability Engineer

Site Reliability Engineer в HotBox S3

Middle+ Site Reliability Engineer (SRE)

DevOps Site Reliability Engineer / SRE

Инфраструктурный инженер (Infrastructure Software Engineer/Site Reliability Engineering)

Вакансия в подборках

Похожие вакансии