- Работа в Санкт-Петербурге
- IT, интернет, связь, телеком
- Инженер по надежности
- Инженер по надежности (SRE) - Senior, Lead в Платформу обслуживания
Инженер по надежности (SRE) - Senior, Lead в Платформу обслуживания
По договоренности
Наша команда SRE обеспечивает мониторинг, реагирование на инциденты и внедрение SRE практик в процессах обслуживания всех продуктов Т-Банка. Мы делаем наше обслуживание доступным для клиентов 24/7.
Команда находится в новом направлении надежности у платформы обслуживания. Направление занимается исследованием и влиянием на техническое качество процессов, разработкой и реализацией инструментов для обеспечения высококлассного мониторинга клиентских услуг, снижением нагрузки на КЦ путем быстрого тушения пожаров, контролем технического качества компонентов до релизов и после, развитием надежности сервисов платформы обслуживания.
Обязанности:
Глобальная задача - внедрение полноценного процесса SRE в поддомене, где на данный момент есть только самые начальные атрибуты этого процесса. SRE практики на уровне компании уже имеют высокую степень зрелости и стандартизации, нужно внедрить их в подразделении.
Особенность текущего ИТ ландшафта - есть большой скоуп решений на лоу-код стеке.
Задачи:
- готовность к расследованию инцидентов и дежурствам по доступности продакшена в рабочее время
- пост-анализ инцидентов, выработка и контроль решений по улучшению надежности
- общение со стейкхолдерами и синхронизация требований по доступности
- тесное взаимодействие с продуктовыми командами разработки на предмет работы с доступностью и организация соответствующих процессов
- проактивное участие в улучшении надежности поставляемых продуктов
- управление командой SRE из 3 инженеров
- постановка и сопровождение целей команды по методике OKR с сопутствующей отчетностью
- определение, сбор и ответственность за метрики доступности продуктов отдела
- определение векторов развития инструментария SRE в отделе и последующая имплементация решений
- опыт от 3х лет в разработке, автоматизации тестирования ПО и / или SRE
- опыт руководства командой, наставничества, менторства или готовность его получить и и активно развивать
- опыт организации или соорганизации процессов SRE в команде разработки
- опыт дежурств и расследования инцидентов продакшена
- опыт работы с Grafana, Sage (логи, алерты, дашборды)
- умение определять метрики доступности и влиять на них
- навыки программирования
- Знание Docker, CI/CD, практик Canary, Rolling Update, Blue-Green Deployment, Probe тестирование, Infrustructure-as-a-code
- понимание CI/CD GitLab и способность его настройки под процессы SRE
- знание архитектуры распределенных приложений: шардирование, репликация, балансировка и другое
- хорошие коммуникационные навыки
- умение анализировать ситуацию, предлагать эффективные идеи и решения
-
Работу в офисе или удаленно — по договоренности
-
Возможность работы в аккредитованной ИТ-компании
-
Платформу обучения и развития «Т‑Банк Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии
-
Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев. Предложим льготное страхование вашим близким
-
Бесплатный фитнес-зал или компенсацию затрат на спортивные занятия
-
3 дополнительных дня отпуска в год
-
Уникальную well-being-программу, направленную на физическое и ментальное благополучие сотрудников
-
Достойную зарплату — обсудим ее на собеседовании
Опубликована 13 часов назад