Инженер по надежности (SRE) - Senior, Lead в Платформу обслуживания

По договоренности


Наша команда SRE обеспечивает мониторинг, реагирование на инциденты и внедрение SRE практик в процессах обслуживания всех продуктов Т-Банка. Мы делаем наше обслуживание доступным для клиентов 24/7.

Команда находится в новом направлении надежности у платформы обслуживания. Направление занимается исследованием и влиянием на техническое качество процессов, разработкой и реализацией инструментов для обеспечения высококлассного мониторинга клиентских услуг, снижением нагрузки на КЦ путем быстрого тушения пожаров, контролем технического качества компонентов до релизов и после, развитием надежности сервисов платформы обслуживания.


Обязанности:

Глобальная задача - внедрение полноценного процесса SRE в поддомене, где на данный момент есть только самые начальные атрибуты этого процесса. SRE практики на уровне компании уже имеют высокую степень зрелости и стандартизации, нужно внедрить их в подразделении.

Особенность текущего ИТ ландшафта - есть большой скоуп решений на лоу-код стеке.

Задачи:

  • готовность к расследованию инцидентов и дежурствам по доступности продакшена в рабочее время
  • пост-анализ инцидентов, выработка и контроль решений по улучшению надежности
  • общение со стейкхолдерами и синхронизация требований по доступности
  • тесное взаимодействие с продуктовыми командами разработки на предмет работы с доступностью и организация соответствующих процессов
  • проактивное участие в улучшении надежности поставляемых продуктов
  • управление командой SRE из 3 инженеров
  • постановка и сопровождение целей команды по методике OKR с сопутствующей отчетностью
  • определение, сбор и ответственность за метрики доступности продуктов отдела
  • определение векторов развития инструментария SRE в отделе и последующая имплементация решений
Требования:
  • опыт от 3х лет в разработке, автоматизации тестирования ПО и / или SRE
  • опыт руководства командой, наставничества, менторства или готовность его получить и и активно развивать
  • опыт организации или соорганизации процессов SRE в команде разработки
  • опыт дежурств и расследования инцидентов продакшена
  • опыт работы с Grafana, Sage (логи, алерты, дашборды)
  • умение определять метрики доступности и влиять на них
  • навыки программирования
  • Знание Docker, CI/CD, практик Canary, Rolling Update, Blue-Green Deployment, Probe тестирование, Infrustructure-as-a-code
  • понимание CI/CD GitLab и способность его настройки под процессы SRE
  • знание архитектуры распределенных приложений: шардирование, репликация, балансировка и другое
  • хорошие коммуникационные навыки
  • умение анализировать ситуацию, предлагать эффективные идеи и решения
Условия:
  • Работу в офисе или удаленно — по договоренности

  • Возможность работы в аккредитованной ИТ-компании

  • Платформу обучения и развития «Т‑Банк Апгрейд». Курсы, тренинги, вебинары и базы знаний. Поддержку менторов и наставников, помощь в поиске точек роста и карьерном развитии

  • Заботу о здоровье. Оформим полис ДМС со стоматологией и страховку от несчастных случаев. Предложим льготное страхование вашим близким

  • Бесплатный фитнес-зал или компенсацию затрат на спортивные занятия

  • 3 дополнительных дня отпуска в год

  • Уникальную well-being-программу, направленную на физическое и ментальное благополучие сотрудников

  • Достойную зарплату — обсудим ее на собеседовании


Поделиться:

Опубликована 13 часов назад

Вакансия в подборках

  1. Инженер
  2. Инженер ТО
Мы обрабатываем данные посетителей и используем куки в соответствии с политикой конфиденциальности.