SRE инженер / Эксперт по обеспечению надежности
По договоренности
МТС Финтех – одно из ключевых направлений экосистемы МТС.
Мы используем современные цифровые решения и развиваем технологичные банковские сервисы, доступные каждому.
Наши команды совершенствуют финтех-продукты для В2В и В2С. Создают сайты на TypeScript + React + Next.js с SSR. И реализуют проекты в Kubernetes-среде, чтобы обеспечивать надёжность для миллионов клиентов МТС Финтех.
Наш стек:
- Linux, PostgreSQL, RDBMS Oracle, ELK, Grafana, Zabbix, BCP/DRP, RTO, RPO, SLA/SLO/SLI, Bash, OSI.
Что для нас важно:
- опыт внедрения практик и инструментов SRE
- знание принципов формирования SLA/SLI/SLO
- умение работать с высоконагруженными сервисами
- знание принципов и методов обеспечения качества и надёжности ИТ сервисов
- навыки работы в Grafana – создание дашбордов, настройка Alerting
- опыт работы с ELK (запросы, визуализация, дашборды)
- навыки работы в ОС Linux, в том числе опыт написания bash-скриптов
- опыт участия в ИТ-проектах или работы в продуктовых командах (взаимодействие с аналитиками, разработчиками, QA)
- высшее техническое образование
Ты будешь:
- внедрять практики SRE на уровне продуктов и систем Банка
- формировать и контролировать реализации нефункциональных требований к доработкам
- прорабатывать и описывать методики диагностики, подготовку эксплуатационных инструкций, обучений L1 и L2
- улучшать метрики надежности, наблюдаемости в продуктах/системах совместно с продуктовыми командами или администраторами систем
- выстраивать процессы управления уровнем сервиса на основе SLA/SLO/SLI
- обеспечивать формирование планов и мероприятий по обеспечению непрерывности (DRP/DRT, катастрофоустойчивость, подтверждению заявленных RTO/RPO)
- проактивно выявлять проблемы и дефекты функционала по продуктовым метрикам, логам, БД
- устранять аварии и нештатные ситуации, выявлять причины, прорабатывать меры, подготавливать Postmortem-отчёты
- проводить анализ ИТ-решений, взаимодействовать с командами и подразделениями в рамках анализа ИТ-решений и интеграций
Опубликована день назад
Похожие вакансии
Компания QApp (ООО «КуАпп») занимается прикладными исследованиями, разрабатывает и пилотирует программные решения в сфере кибербезопасности, активно участвует в процессе разработки государственных стандартов по новым квантово-устойчивым (постквантовы...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
34 минуты назад
Международный онлайн-проект BetBoom в поисках нового сотрудника! Чем предстоит заниматься: Запускать новые продукты компании. У нас они появляются довольно часто и мы помогаем разработчикам их запускать, улучшаем процессы и документации, чтобы запуск...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
30 минут назад
Обязанности: Поддержка и развитие ML-инфраструктуры: Обеспечение бесперебойной работы и масштабирования систем хранения и обработки данных для ML-команды. Разработка пайплайнов данных: Реализация, оптимизация и поддержка пайплайнов для подготовки, тр...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
31 минуту назад
Вам предстоит: Тестирование платежных терминалов; Тестирование личных кабинетов; Разработка тест-кейсов; Разработка тест-ранов; Разбор инцидентов на 3й линии. Мы ожидаем, что у вас есть: Опыт ручного, функционального, приемочного и регрессионного тес...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
день назад
SIEM-инженер (Senior) Приветствую, меня зовут Марина, я являюсь HR компании "Амбрелла - Защита Информационных Систем". Мы ищем опытных SIEM-инженер (Senior) Компания: "Амбрелла - Защита Информационных Систем" Вакансия: SIEM-инженер (Senior) Занятость...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
36 минут назад
Обязанности: Администрирование и техническая поддержка всех решений в Банке на базе ОС Linux. Администрирование и техническая поддержка контейнерной платформы Kubernetes\DeckHouse. Управление качеством работы ИТ систем. Управление контрактами на подд...
- Можно удаленно
- Полный день
- Опыт от 3 лет
- Москва
34 минуты назад